冒頭の画像はGoogle Analyticsのページビューです。”/h/2026514.html“というページに注目してください。WebサイトとしてWordPressを使っている場合、hという名前のディレクトリはありません。また”html”の拡張子で表示されるページも存在しません。
Google Analyticsで参照元を確認すると、”/h/2026514.html”は”your-seo-help.com“というサイトから参照されているようです。”/h/2026514.html”のアクセス数と”your-seo-help.com”が10で一致しているので、新手のリファラースパムと考えて良さそうです。
aguse.jpによる”your-seo-help.com”の確認
リファラースパムによる攻撃者の意図は、「your-seo-help.comって何だろう?」と思わせて、当該アドレスに直接アクセスさせることにあります。もちろんそのアクセスしたサイトは、どこの馬の骨のものかも分かりません。
そこでサイトの身元確認ツールとして使えるのが、aguse.jpです。先日もリファラースパムの被害に遭ってスパムの身元を調べていると、途中でaguse.jpによる確認ができなくなりました。なので今回はaguse.jpで調べた”your-seo-help.com”の主な身元をスクリーンショットにして貼り付けておきます。
サイト概要
詳細情報
その他の情報
“your-seo-help.com”のトップ画面
“your-seo-help.com”を除外する
もちろん”/h/2026514.html”といった存在しないページをGoogle Analyticsで計測されてしまうと、本来のアクセス数が歪められてしまいます。Webサイトの正確な計測値を得たければ、”your-seo-help.com”を参照元から除外する必要があります。
そのためにGoogle Analyticsでは特定の参照元を除外するためのフィルタリング機能が備えられています。そのフィルタリングの中でも正規表現機能を使って除外する方法をご紹介します。
正規表現を使って除外する
フィルタパターンとして、正規表現の”your(.?)*seo(.?)*help.(.+)*”を使う方法です。この場合、”your-seo-help.com”だけでなく、以下のようなドメインも参照元から除外されます。
your-seo-help.org your-seo-help.info yourseohelp.net your__seo__help.com
正規表現を使って一定のパターンの文字列についてすべてフィルタリングしているのは、先日も似たような手口のリファラースパムがあったためです。詳細についてはこちらのページを参考にしてください。