1. TOPTOP
  2. Webサービス
  3. Google

リファラースパム(your-seo-help.com)を Google Analytics [ビュー設定]→[フィルター]の正規表現機能でアクセス数にカウントしない方法

|

google_analytics_referrer_spam_2_0

冒頭の画像はGoogle Analyticsのページビューです。”/h/2026514.html“というページに注目してください。WebサイトとしてWordPressを使っている場合、hという名前のディレクトリはありません。また”html”の拡張子で表示されるページも存在しません。

google_analytics_referrer_spam_2_1

Google Analyticsで参照元を確認すると、”/h/2026514.html”は”your-seo-help.com“というサイトから参照されているようです。”/h/2026514.html”のアクセス数と”your-seo-help.com”が10で一致しているので、新手のリファラースパムと考えて良さそうです。

aguse.jpによる”your-seo-help.com”の確認

リファラースパムによる攻撃者の意図は、「your-seo-help.comって何だろう?」と思わせて、当該アドレスに直接アクセスさせることにあります。もちろんそのアクセスしたサイトは、どこの馬の骨のものかも分かりません。

google_analytics_referrer_spam_2_2

そこでサイトの身元確認ツールとして使えるのが、aguse.jp(新しいタブで開く)です。先日もリファラースパムの被害に遭ってスパムの身元を調べていると、途中でaguse.jpによる確認ができなくなりました。なので今回はaguse.jpで調べた”your-seo-help.com”の主な身元をスクリーンショットにして貼り付けておきます。

サイト概要

google_analytics_referrer_spam_2_3

詳細情報

google_analytics_referrer_spam_2_4

その他の情報

google_analytics_referrer_spam_2_5

“your-seo-help.com”のトップ画面

google_analytics_referrer_spam_2_6

“your-seo-help.com”を除外する

もちろん”/h/2026514.html”といった存在しないページをGoogle Analyticsで計測されてしまうと、本来のアクセス数が歪められてしまいます。Webサイトの正確な計測値を得たければ、”your-seo-help.com”を参照元から除外する必要があります。

そのためにGoogle Analyticsでは特定の参照元を除外するためのフィルタリング機能が備えられています。そのフィルタリングの中でも正規表現機能を使って除外する方法をご紹介します。

正規表現を使って除外する

google_analytics_referrer_spam_2_7_2

フィルタパターンとして、正規表現の”your(.?)*seo(.?)*help.(.+)*”を使う方法です。この場合、”your-seo-help.com”だけでなく、以下のようなドメインも参照元から除外されます。

your-seo-help.org
your-seo-help.info
yourseohelp.net
your__seo__help.com

正規表現を使って一定のパターンの文字列についてすべてフィルタリングしているのは、先日も似たような手口のリファラースパムがあったためです。詳細についてはこちらのページ(新しいタブで開く)を参考にしてください。