【Search Console】リンクスパムサイトURL一覧
最近、スキマ時間を見つけて「Google Search Console」の「検索パフォーマンス」で当サイトのコンテンツがどんなキーワードでよく検索されているのかを見ています。
当サイトが独自ドメインへ移転したのを機に、一度 Search Console を使って内部リンクが正しく張られているかチェックしようと思い、「リンク」>「内部リンク」を使ってチェックしていたところ、お隣に表示されている「(外部リンクの)上位のリンク元サイト」に全く聞いたことのないドメイン名が「hatena.ne.jp」「reddit.com」「yahoo.co.jp」などおなじみのドメインと並んで表示されているのに気づきました。
「○○.xyz」とか、「△△.best」とか、いかにも怪しげな感じのドメイン名です。(もし真面目なサイトに使っている人がいたらごめんなさい)
以前まとめた リファラースパムサイト一覧 では、『実際にはあなたのサイトへのリンクが張られていないのにも関わらず、あなたのサイトのアクセスログやGoogle Analyticsの解析結果に「リンク元URL」として足跡を残すことを目的とするクローラーを使っているサイト』のことを「リファラースパムサイト」として、私が管理するサイトで実際に見つけたリファラースパムサイトのURL一覧表を掲載していますが、
今回の場合、
・Search Console で調べると実際に当サイトへのリンクが張られている
・しかし当サイトの記事の紹介とかではなく、「Microsoft Bing検索」の検索結果一覧(当サイトが上位表示されているキーワードで検索したもの)がリンク元になっている
(危険なサイトの可能性もありますので、リンク元に実際にアクセスするのは極力避けましょう!)
・ほとんど同じURL(URLの後のパラメーターが少しだけ違う)の多数のページから同一ページに対してリンクが張られているため、「ターゲットページ」に対して「リンクしているページ」が不自然なほど多い
・リンク元のドメインの情報を調べてみると、bing.com や Microsoft とは全く無関係の、最近登録されたドメイン
という特徴があり、リファラースパムサイトとは少し違った感じです。
調べてみると、このようなサイトのことを「リンクスパムサイト」と言うそうです。
リンクスパムサイトはリファラースパムサイトとは異なり、ターゲットとなるサイトへのリンクが実際に張られているのが特徴ですが、「実際にリンクが張られているから良いじゃない」といった単純な話ではないようです。
一般的にリンクスパムサイトは「低品質なサイト」とGoogleに認定されるため、一旦リンクスパムサイトから自分のサイトにリンクを張られてしまうと、自分のサイトの検索順位が低下するだけでなく、最悪Googleからのペナルティを受けてインデックスから削除されてしまうリスクもあります。
Googleで「リンクスパムサイト」を検索した際の AI による概要は下記の通りです。
(Search Labs | AI による概要)
リンクスパムサイトとは、検索エンジンのランキングを不正に操作することを目的として、低品質なリンクを意図的に作成・配布するサイトのことです。
リンクスパムサイトから自社サイトにリンクを貼られると、検索順位の低下や、Googleからのペナルティによる検索結果からの削除(インデックス削除)などのリスクがあります。
スパムリンクの例としては、次のようなものがあります。
リンクのみを集められたページ、コピーしたコンテンツ、過剰なキーワード埋め込み、隠しリンク、 無関係なリンク。
スパムサイトからリンクを貼られた場合は、リンクを貼ったサイトに直接問い合わせ、削除を依頼することもできます。また、Googleが運営する「リンク否認ツール」を活用することもできます。
|
「スパムサイトからリンクを貼られた場合は、リンクを貼ったサイトに直接問い合わせ、削除を依頼する」とありますが、いろんな意味で話の通じる相手ではないでしょうし、労力をかけても目を付けられてかえって逆効果になる可能性が高いので、さっさともう一つの方法である「リンク否認ツール」の活用で対処することにしました。
まずは、当サイトへのスパムリンクが特に多かった「sinfisha.cn」について詳しく調べてみます。
ドメインが「.cn」なので、中国のサイトですね。
(→ ドメイン名の国別コード(ccTLD)一覧)
当サイトは全て日本語で記述しており、中国のサイトからリンクされる心当たりは全くありません。
一応、.cn ドメインの WHOIS LOOKUP で調べてみましたが、当然 Microsoft とは全く無関係で、個人登録のドメインっぽいです。
2023年9月16日に登録されている比較的新しいドメインです。
一応「"sinfisha.cn Bing"」でググって確認しましたが、やはり Bing とは全く無関係のようです。
「sinfisha.cn」から当サイトへのリンクは
「https://sinfisha.cn/search?q=[当サイトのキーワード]&FORM=[ここの文字列がそれぞれ微妙に異なる]」
といった形式の、ほぼ同じ内容の複数のページから張られており、リンク元のページを念のため確認してみると(←危険ですのでマネしないで下さいね)、Microsoft Bing で上記の(当サイトのキーワード)で検索したときの結果が表示されます。
もちろん中国語ではなく日本語ですし、Microsoft Bing のロゴも表示され、一見すると正規の Bing 検索の結果に見えますが、全く同じキーワードで正規に Bing 検索した場合の検索結果とは順位が若干入れ替わっていたので、丸パクリではなく何らかの意図があるように見えます。
(あるいは単にパクったタイミングでの順位がそのまま反映されただけなのかもしれません)
当サイトに対してなぜスパムリンクを張るのか、目的を考えてみたのですが、
・Bing の検索結果を勝手にパクって自社からのアクセス・リンクのように見せかけ、検索でのランキングを高める
(ドメイン全体の「価値」を高めて売却するのが目的?)
・広告は表示されないので、少なくともアフィリエイト目的ではない
一方、リンクスパムサイトのコンテンツに Google 検索結果ではなく Bing 検索結果を使っているということは、
・Googleで上位表示を狙う輩が、自社で上位表示したいキーワードで Bing 検索し、自社サイトを除去した検索結果をそのままリンクスパムサイトでコンテンツ化
➡ (わざと)Googleに「低品質なサイト」と認定されることで、リンクを張られた自社以外のサイト(Google検索での上位表示サイト)の検索順位が低下
➡ 相対的に自社サイトのGoogle検索順位 up
ということも考えられます。
でも果たしてそこまでやりますかねぇ。あまりこんなことは考えたくないのですが。
また、各サイトに流入する際の検索キーワードは通常、Bing なら Microsoft社しか知り得ないと思うので、トロイの木馬系のウイルスに感染したパソコン・スマホから検索キーワードを自動収集して、そのキーワードで Bing 検索 → 検索結果をそのまま自社のコンテンツとして掲載
ということも考えられます。
AIとかRPAとか使えば、日本語が全く分からない人でもほとんど手間をかけずに自動生成でリンクスパムサイトを構築できそうな気もします。
しかも、キーワードに応じて動的に生成される検索結果のページがパクリ元なので、
・他のサイトのコンテンツとかぶらず、パクリコンテンツと見なされる可能性が少なく(ロゴとか丸パクりですが)
・リンク先には一定の関係性があり(キーワードに基づく上位の検索結果なので当然)
・過剰なキーワード埋め込み、隠しリンクなどもありません(基本 Bing なので)。
そんなページを自動生成で何万ページも作って登録すれば、もしかしたら「低品質なリンクスパムサイト」ではなく「オリジナルコンテンツが何万ページもある優良サイト」と認定される可能性すらあります。
とんでもない話ですね。
結局のところ、当サイトへのリンクの意図は分からず非常に気持ち悪いのですが、下記のリストに記載している他のサイト(リンク元を全て確認したわけではありませんが)も含め、検索結果のページを Bing 等からパクってきて「オリジナルコンテンツ」に見せかけている「低品質な」サイトということだけは確実に言えるかと思います。
全く聞いたこともない海外のサイトから変な形で勝手にリンクされるのは気持ちの良いものではありませんし、当サイトの価値向上には全く寄与していないと考えられます。
最悪、古いブラウザからリンクスパムサイトにアクセスすると個人情報を抜かれたりする可能性もありますので、リンクスパムサイトからのリンクはさっさと拒否(否認)するのが一番です。
否認リストの作成方法やフォーマットはSearch Console のヘルプページに詳細に記載されていますのでご自身でご確認下さい。
またリンクの否認ツールのページはこちらです。
リストファイルのアップロードはリンクの否認ツールのページからお願いします。
ページ単位でもドメイン単位でもリンクを否認できますが、今回の場合、ページ単位で対応するとキリがないため、ドメイン単位でバックリンクを否認します。
ドメイン全体からのリンクを否認するためには「domain:」というプレフィックスを付けます。
否認したいドメイン名を書き込みアップロードするファイルには100,000 行(空白行とコメント行を含む)および 2 MBまでリストアップできるとのことです。
100,000行www と思ったのですが、もしかしたら当サイトのような弱小サイトではなく、いろいろなキーワードで Bing 検索上位表示されるサイトはとんでもない数のスパムサイトに狙われているのでしょうか。
嫌な世界ですね。
念のため、「リンク否認ツール」の活用シーンだけ引用しておきます。
次の場合にのみ、バックリンクを否認する必要があります。
1. サイトに対して、スパム行為のあるリンク、人為的リンク、品質が低いリンクが数多くある。
かつ
2. そのようなリンクが、自分のサイトで手動の対策を行わなければならない原因となっている、または今後、手動による対策を行わなければならなくなる可能性がある場合。
|
今回の場合がまさにそうです。
否認ツールは複雑な機能であるため、慎重に使用する必要があります。使い方を間違えると、Google 検索結果でのサイトのパフォーマンスに影響が及ぶ可能性があります。
|
OK Google.
下記は当サイトのコンテンツに対して実際にスパムリンクを張っていたリンクスパムサイトの一覧表です。
リンクスパムサイトかどうかを一つずつ調べてリストアップするのは大変なので、スパムリンクの数が多いもののみ掲載しています。
2024年10月時点のデータです。
|
URL(ドメイン) |
19991014.xyz |
443221.xyz |
520.edu.pl |
5269.best |
conan2.xyz |
cxk.pp.ua |
deem.love |
hanghao.ink |
harrychang.xyz |
hbbd.asia |
huan-yue.org |
iapa.com.cn |
igdu.xyz |
littlesheep.fun |
melikeme.cn |
mixci.live |
mmwf.xyz |
nvoid.top |
pages.dev |
privnets.com |
pylindex.xyz |
ritanlisa.com |
rn-dgp08.xyz |
shuct.net |
sinfisha.cn |
spaceleo721.site |
szy.wiki |
toolspro.vip |
twx.best |
xihuanlwa.ink |
yibei2013.top |
yworldnews.com |
|
|