Googleが200以上の要素からランクを決定しているという話は聞かれたことがある方も多いかと思われます。とはいえ、正確に200要素が一体どのような内容で成り立っているのか、ということを知っている人はいないのではないでしょうか。
海外では実際にこのGoogleのアルゴリズムを構成する要素の中身を解明しようという動きがあります。少し前にWebmaster Worldでは「Google Algorithm – What are the 200 Variables?(Googleのアルゴリズム – 200の変数とは何か?)」というスレッドが投稿されました。これは今年の11月10日から13日にかけて開催されたPubConで、GoogleのMatt Cutts氏がGoogleのアルゴリズムには200を越える変数がある、といったことを受けて投稿されたもので、現在も議論が続いています。
ここで紹介するのはそのWebmaster Worldの議論ではなく、2009年12月18日付でSearch Engine Journalに投稿された「Let’s Try to Find All 200 Parameters in Google Algorithm(Googleのアルゴリズムに含まれる200全てのパラメータを見つけよう)」です。
Ann Smarty氏が、この記事を書くきっかけになったのも先に上げたWebmaster Worldの議論のようで、同じようにSearch Engine Journal内でも、Googleアルゴリズム解明してみたいという思いからのようです。
200という数字が出ていますが、ここに掲載されているのは117 130要素で、実際には200ではありません。Smarty氏も同記事内でこれをきっかけにして、リスト完成に貢献して欲しいと呼びかけています。
ここではSmarty氏の許可をいただき、その投稿の和訳を以下に掲載しています。
文中の(?)は原文のままです。また、文中のリンクも原文に付いていたものをそのまま掲載しています。できる限り内容に忠実に訳そうと心がけましたが、私の英語力の拙さのせいで、意味がうまく取れない部分もあるかも知れません。「この訳はこうした方が正確だ」等、ご意見・ご提案がありましたら、ぜひお知らせください。
※2009年12月22日更新
元記事の更新に伴い9項目を新たに追加しました(計126項目)。
※2009年12月26日更新
元記事の更新に伴い4項目を新たに追加しました(計130項目)。
※2010年1月29日更新
元記事のアップデート情報に関する箇所を追加しました。また、文中で言及されているMark Nunney氏の作成したドキュメントへリンクしました。こちらも一覧表としてうまくまとめられています。正確には数えていませんが、いくつか新しい項目も追加されているように思われます。併せて参考にしてみてください。
Googleのアルゴリズムに含まれる200全てのパラメータを見つけよう
私はGooglerたちが、これを楽しむはずだと確信しています。一言でいうのは非常に難しく、たくさんの推測と憶測が続いているこれです。今回、Matt Cuttsは、Googleのアルゴリズムに含まれているそれら200の変数に言及したといわれますし、既に多くの人々がそれらを探し始めています。
ともかく、私がこのフォーラムのスレッドを見つけて決心したのは、私自身の変数リストを提供し、皆さんに協力を依頼することによって、Search Engine Journalでもこの議論を共有しようということでした。
今のところ、リストには120130以下の変数しかありません。
200になるよう挑戦してみてください。
アップデート: 専用のGoogle Waveを創りました。見たり参加するには私宛にツイートかメールしてください。
アップデート: 素晴らしく、そしてスマートなSEOで、同時にWordstream blogのブロガーでもあるMark Nunneyがコラボ用のWaveに加わり、素晴らしいテーブルを用意してくれました。
私は、(投票できる)「重要度カラム」と「依存度」カラムを付け加えた。フレーズはマズいけれど、重要なことはつまり、こういったリストが的外れなのは、多くの「大きな」「パラメータ」がそれ自体では何にもならないからだ。ブランドであれサイトの評判であれ、それ自体は使えないんじゃないだろうか? CNNやBCCは全てにおいてトップに来るわけじゃない。
ここにコピーを公開しました(私たちは空カラムの変数に投票するための手筈を整えようと考えています)。
私たちが(信じている度合いは異なりますが)アルゴリズムに含まれているとほぼ確信しているパラメータは次の通りです(参考までに、リストの一部に、トピックに関して既にある議論へのリンクを貼っています)。
ドメイン: 13要素
- ドメイン年齢
- ドメイン登録期間の長さ
- 秘密あるいは匿名のドメイン登録情報
- サイトのトップレベルドメイン (地理的フォーカス、例: comとco.uk)
- サイトのトップレベルドメイン (例: comとinfo)
- サブドメインかルートドメインか
- ドメインの過去の履歴(どの程度IPを変えたか)
- ドメインの過去の所有者(どの程度所有者が変わったか)
- ドメインに含まれるキーワード
- ドメインのIP
- 近接したドメインのIP
- (リンクなしの)ドメインの外部での言及
- Googleウェブマスターツールでのジオターゲティング設定【09/12/26追加】
サーバーサイド: 2要素
- サーバーの地理上の場所
- サーバーの信頼性と動作可能時間(アップタイム)
設計: 8要素
- URLの構造
- HTMLの構造
- セマンティックな構造
- CSS / JSファイルの外部使用
- サイト構造のアクセシビリティ(Javascript等アクセスできないナビゲーションの使用)
- 正規(canonical)URLの使用
- 「正しい」HTMLの使用(?)
- Cookieの使用【09/12/26追加】
コンテンツ: 14要素
- コンテンツの言語
- コンテンツの独自性
- コンテンツの量(HTMLに対するテキスト量)
- リンクの無いコンテンツの密度(テキストに対するリンク量)
- (リンク、画像、コードを伴わない)テキストだけのコンテンツの割合
- コンテンツの時事性と適時性(例えば季節的な検索のような)
- セマンティックな情報(句単位の指標付け[phrase-based indexing]や共起句の指標[co-occurring phrase indicators])
- (交流/取引、情報、ナビといった)一般的なカテゴリに関するコンテンツ・フラグ
- コンテンツ / 市場の隙間(niche)
- フラグの立ったキーワードの使用(ギャンブルや出会い系などのボキャブラリ)
- 画像に含まれるテキスト(?)【09/12/22追加】
- (ハッカーによって加えられたような)悪意あるコンテンツ【09/12/22追加】
- はびこる綴り間違い、誤った文法、句読点を欠いた1,0000語にも及ぶ長文【09/12/22追加】
- 完全に個性的な、あるいは新しいフレーズ【09/12/22追加】
内部横断的リンク(Internal Cross Linking): 5要素
- ページへの内部リンクの数
- 同一のアンカーテキスト、あるいはターゲットであるアンカーテキストを持つページへの内部リンクの数
- (ナビゲーションバーやパン屑リスト等の代わりに)コンテンツからページへの内部リンク数
- nofollow属性を使うリンク数(?)
- 内部リンクの密度
ウェブサイト: 7要素
- Robots.txtファイルの内容
- 全体的なサイトの更新頻度
- 全体的なサイトの規模(ページ数)
- 最初にGoogleに発見されてからのサイト年齢
- XMLサイトマップ
- ページ内部の信頼性フラグ
- ウェブサイトのタイプ(例: トップ10に入る情報サイトの代わりとなるブログ)【09/12/22追加】
ページの固有要素: 9要素
- ページのメタ・ロボットタグ
- ページ年齢
- ページの新鮮さ(freshness)(編集の頻繁さとページの編集によって与えられる[変化させられる]ページの割合)
- サイト内の他のページとのコンテンツの重複(内的重複コンテンツ)
- ページの内容の可読レベル(?)
- ページのロード時間(ここに多くの要素が含まれる)【09/12/22修正】
- ページの種類(運営者情報ページとメインコンテンツページ)
- ページの内的ポピュラリティ(どの程度内部リンクを持っているか)
- ページの外的ポピュラリティ(このサイトの他のページに関連する外的リンクをどれくらい持っているか)
キーワードの利用とキーワードの卓越性: 13要素
- ページのタイトル内のキーワード
- ページタイトルの最初のキーワード
- Altタグ内のキーワード
- 内部リンク(内部アンカーテキスト)のアンカーテキストに含まれるキーワード
- 発リンクのアンカーテキストに含まれるキーワード(?)
- ボールドとイタリック体のキーワード(?)
- ボディ内テキストの始まりに含まれるキーワード
- ボディ内テキストに含まれるキーワード
- ページ / サイトのテーマに関連するキーワードの類義語
- ファイルネームに含まれるキーワード
- URLに含まれるキーワード
- 「目的が乱雑」でない(ドメインに含まれる「キーワード」、ファイル名に含まれる「キーワード」、タイトルの最初の言葉になる「キーワード」、descriptionとkeywordタグの最初の行の最初の言葉に含まれる「キーワード」を設置)【09/12/26追加】
- HTMLのコメントタグ内に利用されるキーワードの使用あるいは乱用【09/12/26追加】
発リンク: 8要素
- (ドメイン毎の)発リンク数
- (ページ毎の)発リンク数
- サイトがリンクしているページの品質
- 危険なサイトへのリンク
- 発リンクの関連性
- 404や他のエラーページへのリンク
- クライアントサイトからSEO業者へのリンク
- 人気のリンク先である画像【09/12/22追加】
被リンク分析: 21要素
- リンクしているサイトの関連性
- リンクしているページの関連性
- リンクしているサイトの品質
- リンクしているページの品質
- サイトのネットワーク内の被リンク
- (類似した被リンクソースを持つサイトの)共引用
- リンク分析結果の多様性
- アンカーテキストの多様性
- リンクサイトのIPアドレスの相違
- 地理的な多様性
- TLDsの相違
- 話題の多様性
- リンクサイトの種類の相違(ログ、ディレクトリ等)
- リンク配置の多様性
- 被リンク毎の(CNNやBBC等の)オーソリティ・リンク
- 危険なサイトからの被リンク(フラグを立てられたサイトからの被リンクの有無)
- (全体的な被リンク分析結果に関する)相互リンクの割合
- (全体的な被リンク分析結果に対するソーシャルメディアサイトからの)ソーシャルメディアリンクの割合
- (被リンクの急増や急落の様な)被リンクの傾向とパターン
- WikipediaとDmozでの引用
- (リンク売買で罰せられたか、等の)被リンク分析結果の履歴
- ソーシャルブックマークサイトからの被リンク【09/12/22追加】
個別の被リンク: 6要素
- (comやgov等の)TLDsの権威
- リンクしているドメインの権威
- リンクしているページの権威
- リンクの場所(フッターやナビゲーション、ボディ内テキスト等)
- リンクのアンカーテキスト(とリンクしている画像のaltタグ)
- リンクの
title属性
訪問者の分析結果と行動: 6要素
- 訪問数
- 訪問者層
- 直帰率
- (他のサイトを訪問する傾向にあるといった)訪問者の閲覧傾向
- (来訪の急激な増加のような)訪問傾向とパターン
- そのリストが(他のリストとの関連で)SERPs内でどの程度クリックされているか
ペナルティ、フィルター、不正操作: 12要素
- キーワードの過剰使用 / キーワードスタッフィング等
- リンク購入フラグ
- リンク販売フラグ
- スパム行為の記録(コメント、フォーラム、その他のリンクスパム)
- クローキング
- 隠しテキスト
- 重複コンテンツ(外部での重複)
- ドメインに関する過去のペナルティ履歴
- 所有者に関する過去のペナルティ履歴
- 所有者の他の所有物に関する過去のペナルティ履歴(?)
- 過去のハッカーの攻撃記録【09/12/22追加】
- 301フラグ: 二重のリダイレクトないしリダイレクトのループ、あるいは404エラーで終わるリダイレクト等【09/12/22追加】
その他の要素: 6要素
- Googleウェブマスターツールでのドメイン登録
- Googleニュースにおけるドメインの有無
- Googleブログ検索におけるドメインの有無
- Google Adwordsにおけるドメインの利用
- Google Analyticsにおけるドメインの利用
- ビジネス名やブランド名の外部的な言及
関連情報
Ann Smarty氏は有名なSEOコンサルタントで、Search Engine JournalやSEOmozに記事を投稿されています。Smarty氏のブログ「Ann Smarty – SEO Consultant」や「SEO Smarty」、Twitter「Ann Smarty (seosmarty) on Twitter」でも有益な情報を得ることができますので、興味のある人は購読/フォローしてみてはいかがでしょうか。
またこの記事に関連する投稿としては次の記事も参考になります。
IE6だとメッチャずれてます。。。
ゲストさん、コメントありがとうございます。
私の環境ではIE6で確認しても特に崩れていません。もしかして、JavascriptをOffにされていますか?当サイトは実験的にHTML5でサイトを作るために、IE用にJavascriptでHTML5の要素を作り出しています。ですので、Javascriptを切られていると、適切に表示されないかもしれません。
ご了承ください。
あるいは、ページが最後まで読み込まれていない可能性もあります。その場合は一度リロードしてみてくださいね。もし、それ以外の理由で崩れていて、原因をご存知でしたらぜひお教えください。
よろしくお願いします。
google ローカルビジネスセンターがないかな
Lさん、コメントありがとうございます。
google ローカルビジネスセンターはその他の要素あたりに入るかも知れませんね。