ブログ ブログ運用

存在しないページへのアクセス!リファラースパムをフィルタリングして除外する方法

グーグルアナリティクスを使ってアクセス解析をしていると、存在しないページへのアクセスが表示されることがあります。
存在しないページへのアクセスとは下の図のようなアクセスです。

存在しないページへのアクセス

グーグルアナリティクスを使えば、あなたのブログのどのページへ何人の人がアクセスしているのか確認することができます。
で、どのページにアクセスされているのか確認すると、このページへ何人アクセスしていますというデータが表示されます。

今回のデータを見ると次のようなページへアクセスされています。

/sharebutton.to
/www1.free-share-buttons.top
/16777543-1.compliance-donald.xyz
/16777543-1.compliance-elena.xyz
/16777543-1.compliance-alex.xyz

ではそのページはいったいどんなページなのかを確認するために、自分のブログのURL、例えば「https://under-q.com/sharebutton.to」を確認してみると次のように表示されます。

404エラー

なぜ存在しないページへのアクセスが表示されるのか?
そして、どのようにすればそのアクセスを除外することができるのかをまとめてみました。

そもそもリファラースパムとは?

そもそも、どんな仕組みで存在しないページへのアクセスが表示されるのか?
アクセス解析を見ていると、例えばロシアからのアクセスが集まっていたとします。
で、どのページへアクセスが集まっているのか確認すると「X.html」というページへのアクセスでした。

リファラースパム仕組み

例えば、この場合。

under-q.com/A.html
under-q.com/B.html
under-q.com/X.html

アクセス解析上はこの3つのページへアクセスが来ていたとします。
しかし、「under-q.com/X.html」というページはアクセス解析上表示されているものの、実際は存在しないページでした。

こんなことがなぜ起こるのか?というと、そもそも「X.html」というページは、まったく別のサーバー上のページに、あなたのグーグルアナリティクスのアクセス解析タグだけが書き込まれているからなのです。

リファラースパム仕組み2

つまり、実際に存在するページは「XXX.com/X.html」というページなのですが、そのページにあなたのアクセス解析タグがきさいされているので、アクセス解析ツール上は「under-q.com/X.html」へのアクセスとしてカウントされているわけです。

厳密にいうともっと複雑な仕組みをつかっているスパムもあるみたいなのですが、おおよそはこんな感じです。

実際にタグが埋め込まれているページを見てみると、ロシア?のページで「メリークリスマス!」と書いてありました。

スパム?

なんかおめでたいですね。
リファラースパムの目的は、アクセス解析をしている人が気になってスパムページへアクセスしてくるようにするという目的があるので、くれぐれもリファラースパムのページへはアクセスしないようにしてください。

場合によってはウイルス満載のページへ誘導されたりします。

どうすればリファラースパムのアクセスを除外できるのか?

じゃあどうやってリファラースパムのアクセスを除外するのか?

例えば、
国を指定してその国からのアクセスを除外したり。
キーワードでnot setとなっているものを除外したり。

いろんな方法があるみたいなんですけど、私の場合はドメインを指定することでリファラースパムのアクセスを除外しています。

ホスト名

具体的には。
グーグルアナリティクスのフィルタ設定で。

右のみを含む 
ホスト名へのトラフィック 
次を含む 
ホスト名「あなたのドメイン」

としてしまいます。

グーグルアナリティクスでは、「UA-」で始まるトラッキングIDが一致すれば、通常ではどのホスト名(ドメイン名)でもアクセスがカウントされる仕組みになっています。

つまり、先ほどの例で考えると「XXX.com/X.html」にあなたのトラッキングIDが埋め込まれているので、「XXX.com」に存在するページなのにも関わらず「under-q.com」へのアクセスとしてカウントされてしまっています。
なので、フィルタでホスト名を指定することで、特定のホスト名「under-q.com」だけを計測対象にできます。

ホスト名とかドメイン名って厳密にいうといろいろ違いがあるのですが。
まあ、自分のブログに設定しているドメインを含んでいるページからのアクセスしかカウントしないとしておけば、IDだけ抜き取られたページからのアクセスは一括で除外できるってわけです。

国でフィルターをかけたり、リファラースパムのリストで除外するのはイタチごっこになる

例えば、このフィルターを国でかけてみたり、言語でかけてみたり、一つ一つ除外設定するのって結構めんどくさいので、基本的にはホスト名で除外して、それでも万一アクセスがあるようなら、ひとつづつつぶしていけばいいのかなとおもいます。

ちなみに、私のサイトでは、このホスト名でのフィルターをしただけで今のところリファラースパムからのアクセスは一切なくなりましたので、ぜひ試してみてください。

こちらの記事もどうぞ!(スポンサードリンク)

-ブログ, ブログ運用
-,

© 2024 under-Q