1. TOPTOP
  2. Webサービス
  3. Atom

リファラースパムのドメインがGoogle Analyticsの正規表現機能でフィルタされているかAtomで検証する方法(auto-seo-service.org, auto-seo-service.com, autoseo-service.org, autoseoservice.org)

|

google_analytics_referler_spam_0

【一括で除外】auto-seo-service.org, auto-seo-service.com, autoseo-service.org, autoseoservice.orgのリファラースパムをGoogle Analyticsの正規表現機能でまとめてフィルターする方法(新しいタブで開く)という記事で、以下の4つのドメインをリファラースパムとして除外するために、Google Analyticsの正規表現機能でまとめてフィルタする方法を紹介しました。

  • auto-seo-service.org
  • auto-seo-service.com
  • autoseo-service.org
  • autoseoservice.org

今回の記事では、フィルタとして登録した正規表現が妥当なものであるかどうか、エディタソフトのAtomを使って検証をします。

Atomの正規表現機能

google_analytics_referrer_spam_regex_atom_1

Atomで文字列の検索パターンを表現するための記法を確認するためには、まず”command + N”(Macの場合)でファイルを開きます。”command + F”で文字列の検索機能(Find in Current Buffer)を表示させたのちに、画面の右下にある”.*”と”Aa”のボタンを押して、正規表現機能(Regex, Case Sebsitive)を有効にします。

フィルタの範囲を狭くした正規表現の確認

auto-?seo-?service.(.+)*

前回の記事(新しいタブで開く)より、フィルタの範囲を狭くする場合の正規表現は上記の通りです。

google_analytics_referrer_spam_regex_atom_2

上記の4つのドメインに関しては、この文字列パターンでフィルタがかけられていることが分かります。ですが、もし攻撃者が”auto__seo__service.info”のようなドメインで攻撃を仕掛けきた場合は、Google Analyticsのフィルタリングから漏れることになります。

フィルタの範囲を広くした正規表現の確認

auto(.?)*seo(.?)*service.(.+)*

上記の正規表現は、”auto”と”seo”または”seo”と”service”の間にいかなる文字列が、いくつ並んでもフィルタリングすることが可能です。

google_analytics_referrer_spam_regex_atom_3

“(.?)*”として”auto”と”seo”、または”seo”と”service”の間の文字列を”-(ハイフン)”の決め打ちにしていなません。そのため、”auto__seo__service.info”と言った文字列でもフィルタリングができていることが分かります。