【Google Analytics】リファラースパムサイトURL一覧(+対策方法)

下記の内容及び対策方法は、2024年7月以前の「ユニバーサル アナリティクス」におけるものです。

2024年7月に完全移行となった「Googleアナリティクス4(GA4)」においては、「ボットのフィルタリング」のチェックボックスが無くなり、リファラースパムサイトからのトラフィック(スパムトラフィック)はGoogle側で自動的に除外されるようになりました。

(アナリティクス ヘルプ より)
Google アナリティクス 4 プロパティでは、既知の bot およびスパイダーによるトラフィックは自動的に除外されます。これにより、既知の bot によるイベントは、アナリティクスのデータから可能な限り排除されます。現時点では、既知の bot トラフィックの除外をオフにしたり、除外された既知の bot トラフィックの量を確認したりすることはできません。


リファラースパムかどうかの判定はGoogle側で自動的に行われ、リファラースパムサイトをユーザーが個別に排除する方法はありません。
(「参照元除外」機能を使ってもスパムトラフィック自体は記録されてしまいます)
GA4では実質的に、以前の Google Analytics における「ボットのフィルタリング」のチェックボックスが最初からオンになっているものと考えて良いでしょう。

リファラースパムサイト対策をユーザーが個別に行うのは非常に大変なので、大多数のユーザーにとっては喜ばしいアップデートと言えるでしょう。
(逆に、本ページのURLリストを追加・更新することはかなり困難になりました)

今回の Google Analytics のアップデートを機に、リファラースパムサイトが近い将来消滅することを祈っています。


ある日、Google Analytics のアクセス解析を見ていたら、アクセス元として見覚えのないURLが。
念のためリンク元を確認すると、検索サイトでもないし、そもそも英語やロシア語のサイトだし、何でこんなサイトから、しかもトップページからの直接リンクでアクセスがあるのか分からない・・・

こんな経験ありませんか?

これはほぼ間違いなく「リファラースパム(Referrer Spam)」の仕業です。

「リファラースパム」とは、アクセスログにリファラー(リンク元)情報だけを残していくスパム行為で、リファラースパムを行うためだけの目的でネット上を巡回しているクローラーが多数存在します。
また、リファラースパムによりアクセスログに「リンク元URL」として記録されるサイトのことを「リファラースパムサイト」といいます。
もちろんリファラースパムサイト上にあなたのサイトへのリンクは張られていません。

リファラースパムによるアクセスがあれば、見かけ上のアクセス数は増えますが、良いことは全くありません。
そもそも相手は人間ではなく、あなたのサイトに足跡を残すことだけが目的の「ボット」ですので、関心のあるadsense広告をクリックすることもなければ、amazonのリンクを通じてあなたのサイトのおすすめ商品を購入することも絶対にありません。

「一体何のために??」と思いますが、このようなリファラースパムサイトは、

     
  • サイト管理者にスパムサイトにアクセスさせること自体が目的
    (seoサイト等の宣伝として使われている)
  •  
  • 悪意のあるコードが埋め込まれている恐れがある
  •  
  • あなたのサイトのアクセスログが公開されている場合(※)、スパムサイトに向けて外部リンクが張られている状態となる。
    つまり、あなたのサイトがスパムサイトの踏み台にされてしまう

など、百害あって一利無しです。

(※)アクセスログを意図的に公開している人は少なくとも日本ではほとんどいないかと思いますが、意図せずにgoogleのクローラーから「見える」状態になっている場合があるようです。

というわけで、リファラースパムは下記の対策方法で確実に排除しましょう。

【Google Analyticsの解析結果から排除したい場合】
Google Analytics の「アナリティクス設定」>「ビュー設定」の下の方に、「ボットのフィルタリング」という項目が有りますので、チェックボックスONにして保存。
これだけでOKです。
Googleが把握している既知のボットやスパイダーからのヒットをすべて除外します。
もっとも、Googleでまだボット認定されていないものは除外することができませんが、天下のGoogleより先回りしてリファラースパムサイトを見つけて個別にブロック、というのは現実的でないので、月間何千万PVといった大規模サイトの管理者でない限り、この方法で十分かと思います。

【アクセスそのものを排除したい場合】
リファラースパムサイトからのアクセスそのものを排除する方法としては、

     
  • robots.txt を使用する方法
  •  
  • .htaccess を使用する方法

の2つがあります。
ただし、robots.txt はクローラーに対する「お願い」に過ぎず、リファラースパムのクローラーは robots.txt の内容を平気で無視するものが多いようなので、効果が薄いようです。
対して、.htaccess はサーバの動作を直接制御しますので、クローラーの目的が足跡(アクセスログ)を残すことである以上、ほぼ確実に排除することができます。
ただし、.htaccess はサーバの動作を直接制御するので、無料ブログサービスなどでは使えないところもあります。

# <.htaccessの記載例>
SetEnvIfNoCase Referer (リファラースパムサイトのURL1) spammer=yes
SetEnvIfNoCase Referer (リファラースパムサイトのURL2) spammer=yes
SetEnvIfNoCase Referer (リファラースパムサイトのURL3) spammer=yes
# サイトURLは下記一覧表の左側のURLをコピペ(「https://」は不要)

Order allow,deny
Allow from all
Deny from env=spammer


というわけで、以下にリファラースパムサイトを一覧表にまとめました。
アクセスすると別サイトにリダイレクトされるものもありますのでリダイレクト先も併せてまとめました。
中には危険なサイトもあると思いますので、くれぐれも不用意にアクセスしないで下さい。
(当サイトではリンク先の内容を確認するサービスを使って間接的に確認しています)
ネットで探せばまとめサイトとかに「リファラースパムリスト」として(海外サイトからの転載と思われる)数百ものサイトが記載されたリストが見つかりますが、実際には日本のサイトをターゲットにしていないものも多いですし、そもそもこれらを全部 .htaccess に書き込んだらページの読み込みに支障が出るレベルかと思います。
ですので、以下のリストは 2017.9.1現在、私が管理する(当サイトとは別の)サイトで実際に見つけたもののみを記載しています。


【Google Analytics】リファラースパムサイトURL一覧(2017.9.1現在)
URLリダイレクト先
1-99seo.comsemalt.com
1-free-share-buttons.comsharebutton.net
100dollars-seo.com100dollars-seo.com
3-letter-domains.net3-letter-domains.net
amazon-seo-service.comsemalt.tools
buttons-for-website.comsharebutton.net
event-tracking.comevent-tracking.com
floating-share-buttons.comsharebutton.to
free-fbook-traffic.comsharebutton.net
free-social-buttons.comsharebutton.to
money-for-placing-articles.comrankexperience.com
reddit.comreddit.com
semalt.comsemalt.com
simple-share-buttons.comsimple-share-buttons.com
share-buttons.xyzsharebutton.to
share-buttons-for-free.comsharebutton.net
social-buttons.comsocial-buttons.com
success-seo.comsuccess-seo.com
top1-seo-service.comsemalt.com
top10-way.comsemalt.com
torrent-to-magnet.comtorrent-to-magnet.com

(追記)
最近はリンク元として足跡を残すリファラースパムだけでなく、アクセスログ上で「検索キーワード」としてスパムサイトのURLを書き込む(該当URLで検索されたように偽装する)手口もあり、「キーワードスパム」というそうです。
この場合も、基本的には上記の方法でキーワードスパムを排除することができます。