GoogleのMatt Cutts氏がTwitterで「スクレイピングサイト(コピーサイト)」の情報を集めるフォームをシェアしました。ツイートは以下です。
If you see a scraper URL outranking the original source of content in Google, please tell us about it: http://t.co/WohXQmI45X
— Matt Cutts (@mattcutts) 2014, 2月 27
「Goolge上でオリジナルの情報より上位に来ているスクレイパーのURLを見つけたら教えてください」というシンプルな内容ですね。
添えられているURLのリンク先は「Scraper Report」となっています。
それぞれの項目を訳すと以下のようになります。
スクレイパー・レポート
もし、オリジナルよりも上位表示されているスクレイピングコンテンツを持つページを見つけたら、教えてください。
- コンテンツを盗まれたあなたのサイトのURLはどのURLですか。
例) http://yoursite.example.com/your_awesome_content.html- スクレイパーサイトの正確なURLはどのURLですか。
例) http://shadyseo.com/spammypage.html- 問題を証明するGoolgeの検索結果URLはどのURLですか。
アドレスバーからGoogle検索のURLをコピー&ペーストしてください。- あなたのサイトが以下のウェブマスターガイドラインに従っており、手動措置を受けていないことを確認しましょう。
ウェブマスターガイドラインは「https://support.google.com/webmasters/answer/35769」にあります。あなたのサイトが手動措置を受けていないかチェックする方法については、「https://support.google.com/webmasters/answer/2604824」を確認してください。
サイトを運営していて、非常に困るのは、一生懸命作成したコンテンツを無断で転載されることですね。特にそちらのサイトの方が自分より上位に表示されており、アクセスを集めているのを見ると腹立たしいです。
今まさにその問題で困っているという方は、情報を送信してみてはいかがでしょうか。もしかすると問題解決の一助になるかもしれません。
ただし、情報を送信したからといって直ちに該当URLが削除されることは期待しない方がいいかもしれません。また、Googleにはデジタル ミレニアム著作権法(DMCA)」に基づく異議申し立て用のフォームも用意されています。これに関しては、こちらの記事が詳しいです。
Danny Sullivan氏がCutts氏に問いかけていますが、Cutts氏は、「教えてください」としているだけで、このフォームで送信されたURLを検索結果から除去するとはいっていませんし、(除去するのに用いる可能性もありますが、)むしろ、こうした問題が起こらないように、Googleのアルゴリズムを調整する上で参考にするデータ収集が主な目的である可能性が高いです。
@mattcutts will you actually do removals with this form, or are you harvesting signals to try and prevent the problem algorithmically?
— Danny Sullivan (@dannysullivan) 2014, 2月 27
そういえばGoogleは以前も同じようなフォームを公開していますね。
この時は明確に「テストのため」としていました。
Scrapers getting you down? Tell us about blog scrapers you see: http://t.co/6HPhROS We need datapoints for testing.
— Matt Cutts (@mattcutts) 2011, 8月 26
いずれにせよ、Googleがこの問題に取り組んでくれるのはありがたいことですね。
“Googleが「スクレイピングサイト(コピーサイト)」の情報を収集” への1件のフィードバック