SEOを行う上でしばしば話題になる重複コンテンツの問題に関しては、頭を悩まされる方も多いかと思いますし、一方でいまひとつ良く分からないという方もいらっしゃるのではないでしょうか。
今回はHigh RankingsのJill Whalen氏の記事「There Is No Duplicate Content Penalty(重複コンテンツのペナルティは存在しない)」がとても分かりやすくまとまっていましたので、説明を加えつつ、紹介したいと思います。
Jill Whalen氏は重複コンテンツの問題を大きく分けて3つの観点から説明しています。
- 検索エンジンのフィルタによる重複ページの除去
- 別サイトでのコンテンツの転載
- 同一ページの複数URLでの表示
検索エンジンのフィルタ
個人的な経験から考えてみても、検索エンジンのフィルタによって引き起こされる問題に関して、ペナルティと同一視して語られることは多いように思われます。
ひとつのページが、別の似通ったページの影響で、ある検索クエリの検索結果に表示されないことをペナルティだと思ってしまいがちですが、これは基本的にはペナルティとは関係ありません。Whalen氏はこの点に関して次のように説明しています。
検索エンジンはアルゴリズム上可能な限りユニークなコンテンツを多くインデックスし、ユーザーに届けたがっている。それが仕事であり、(…) 取り組まなくてはいけないことを考慮するならとてもよくやっている。
重複コンテンツが検索エンジンにとって問題であるのは疑いようもない。検索者がある特定の製品ないしサービスを探していて、基本的な情報が同じであるページや検索結果のページを示されたなら、検索エンジンはきちんとした仕事を行うことを失敗している。検索クエリ上の多様な情報をユーザーに供給するために、検索エンジンは既知の情報を除去することを試みる重複コンテンツ「フィルタ」(ペナルティではなく)を作った。確かに、あなたのページがフィルタをかけられたもののひとつならば、それはあなたにとってペナルティのように感じられるかもしれないが、それはペナルティではない―それはフィルタなのだ。
この場合、問題なのは、除去されたページがその他のページのコンテンツとほぼ同じコンテンツしか掲載していないことにありますから、解決策ははっきりしています。つまりWhalen氏の言葉で言うならば、「両方のページを検索エンジンで表示する必要があるなら、それらを十分にユニークなものにする必要がある」ということです。
Whalen氏も指摘しているように、これは機械的なページ作成を行っている際にしばしば問題になります。大量の商品ページ等を作成する必要のあるサイトではどうしても機械的な作業が必要になる場合もありますが、SEOによるトラフィックを期待したい場合は、独自のページを追加するようにすべきでしょう。
別サイトでのコンテンツの転載
これは多くのブロガーが頭を悩ませている問題でもありますね。投稿した記事が別のブログに掲載されることです。
自ら望んでフォーラムやポータルに同じ記事が掲載される場合はもちろんのこと、事前に連絡があって、こちらが了承した場合や、きちんとこちらにリンクされていて、掲載先のブログ記事を構成する目的で掲載される場合、特に問題はありません。これはWhalen氏のいうように、ページが重複しても、場合によってはランキングにおいてオリジナルページより上位に表示されたとしても構わないと思います。
もしあなたの署名入りの記事が別のところで掲載されたならば、それは良いことだ。あなたは他のサイトに異なるバージョンを提供する必要がないし、それらを再掲載する必要も全くない。あなたの記事をホストするサイトが増えれば増えるほど、あなたの信頼性を確立するチャンスを得ると同時に、記事の最後の略歴を通じてあなたのサイトに被リンクを得る。多くの場合、Googleは検索において重複記事をフィルタにかけることさえしないが、もし最終的にひとつのバージョンしか表示されなかったとしても、それは依然としてOKだ。
しかしながら、引用元を示すリンクが設置されていなかったり、全く間違った場所にリンクされていたり、あたかも自分が書いたように掲載されている場合もやはりあります。重複コンテンツの中でも私自身とても気になるのはこういうケースです。
その点で先日投稿した「ツイートの残留効果がSEOに影響を与える」内の「Ohye氏によるSEOのアドバイス」は実際に試す価値がありそうです(まだ試していませんが…)。過去にも渡辺氏の記事「Google、重複コンテンツ(コピペサイト)の対処方法について解説」で「オリジナルの方にリンクを返す」という方法が説明されていますし、自らリンクを含めておくのは効果的だと思います。
コンテンツには署名を含め、サイトや記事のリンクと可能であれば略歴を書いておくことで、その記事が誰に属するものかを明確にできるため、転載された場合でも効果的である可能性は高いと思います。とはいえ、中にはa要素を全て除去したり、リンク先URLを変更するケースもありますから、完全というわけではありませんが。
同一ページの複数URLでの表示
URLの分散に関しては完全に対策ができているサイトはあまり多くないと思います。といいますか、このブログも漏れがたくさんあります。とはいえ、この複数URLの問題はとりわけSEOにおいてとても重要です。この点に関して詳しい説明は鈴木氏の「「重複コンテンツ・重複URL」のおさらい」で行われていますのでそちらを参考にしてください。
Whalen氏はこの問題を唯一問題のある重複コンテンツ問題としています。
重複コンテンツが問題になる可能性があるのは、ウェブサイトが基本的に同じページだが、いくつものURL上にある場合だ。WordPressブログは、ひとつのブログ記事に複数のタグやカテゴリーが付けられる場合、しばしばこれに見舞われる。ブログのソフトウェアは、ユーザーがそれを閲覧するためにクリックするカテゴリーやタグによって、同じ記事に複数のURLを作りだす。この種の重複コンテンツは検索エンジンのペナルティを引き起こしたりしないが、同時に、それはしばしば、記事の全体的なリンクポピュラリティを分割してしまい、望ましいことではない。
あらゆるコンテンツの断片に対して複数のURLを作るバックエンド・システムやCMSは、実際に、検索エンジンにとって問題である可能性がある。というのは、それがスパイダーをいっそう働かせることになるからだ。あなたが別のユニークな情報をインデックスすることを望んでいるときに、同じ情報を何度も何度もスパイダーに発見させることは馬鹿げている。この種の意図せざる重複コンテンツは当然301リダイレクトを通じてか、あるいは正規化リンク要素(rel=canonical)を用いて一掃されるべきだ。
様ざまな場所で既に説明されていますが、重複コンテンツによるペナルティを心配する必要はありません。ただ重複コンテンツによって、ページが表示されない、検索エンジンで順位が下がってしまうといった意図しない結果に陥ることは決して少なくありません。可能ならば、サイトの設計段階から、URLの分散やコンテンツの重複を防ぐ措置を講じておく必要があります。
不正な転載に関しては相手がこちらよりオーソリティを持っている場合など、解決が困難であったり、時間がかかったりする場合が多いようです。そういった場合は解決のために著作権違反を指摘しつつも、やはりサイト自体のオーソリティを高める努力をしていく必要がありそうです。
参考記事
重複コンテンツに関しては既に多くの記事があります。以下で一部を紹介します。