先日、Googleの製品管理担当シニアバイスプレジデントJonathan Rosenberg氏がGoogleのPublic Policy Blogにおいて「オープン性」についてのGoogleの見解を述べました。この件について、詳しくは、Tom Krazit氏(川村インターナショナル訳)の「信条は『オープン性の勝利』–グーグルが示した『オープン』の定義」をご覧頂きたいのですが、この記事から引用するとRosenberg氏はオープン性に関して、次のように述べています。

さまざまな文脈における「オープン」の意味は理性的な人たちの間で意見の相違があり得るが、オープンテクノロジとオープンな情報の活用はGoogleの最も重要な中心的価値のうちの2つである

しかしながら、一方で、Googleのランキング・アルゴリズムについては次のように述べています。

これらのシステムを開放してしまえば、人々がわれわれのアルゴリズムで『ゲーム』をして、検索や広告品質のランク付けを操作できるようになってしまう。これにより、すべての人にとってわれわれの質が下がることになる

これに対して、Chris Dixon氏が「Google should open source what actually matters: their search ranking algorithm(Googleは彼らの検索ランキングのアルゴリズムという実際的に問題となっているソースをオープンにすべきだ)」という記事を書いています。この記事と、この記事に対して投稿されたコメントがとても良い問題提起になっていると思いましたので以下に私なりにまとめつつ、紹介したいと思います。

同記事は、まず膨大なトラフィックを仲介するGoogleのランキングアルゴリズム、そしてそれを管理するごくわずかなエンジニア集団が、ウェブサイトの生死を握っていることを指摘し、Googleのオープン性に対して本当にコミットするならば、検索ランキングのアルゴリズムこそオープンにすべきだと主張します。

そして次のように続けています。

The alleged argument against doing so is that search spammers would be able to learn from the algorithm to improve their spamming methods. This form of argument is an old argument in the security community known as “security through obscurity.” Security through obscurity is a technique generally associated with companies like Microsoft and is generally opposed as ineffective and risky by security experts. When you open source something you give the bad guys more info, but you also enlist an army of good guys to help you fight them.

それを行うことに対する根拠のない主張が、検索スパマーたちが、彼らのスパミングの手段を改善するためにアルゴリズムを学ぶことができるようになるというものである。この種の議論は「曖昧さによるセキュリティ(security through obscurity)」として知られるセキュリティ・コミュニティの古い議論である。「曖昧さによるセキュリティ」は一般にMicrosoftのような企業にゆかりのあるテクニックであり、概してセキュリティの専門家によって効果がなく危険だとして反対されている。ソースを開示して悪い連中に情報を与える時、同時に彼らと戦って助けてくれる良い連中によって成る軍隊を手にするのだ。

興味深いのは、これに対してGoogleのMatt Cutts氏が直接コメントを行ったことです。

Cutts氏は、Dixon氏の主張が理想だともいいつつ、アルゴリズムをオープンにすることをGoogleはしないだろうといいます。「なぜってそれはスパマーたちの生活を楽にし、Googleの検索クオリティを劣化させるから。(…)他の検索エンジン、特にWikiaは完全にオープンソースにしようと試みてきたし、それがそれらの検索の質を向上させる助けになったようには見えない。」と書いています。

このCutts氏のコメントに対し、Danny Sullivan氏がさらにコメントを行っています。

Sullivan氏は、両者の主張に対し基本的な理解を示しつつ、「Googleは故意に、これは明らかにするにはあまりにも微妙であると決めつけている」として、「Googleはそのランキング・アルゴリズムが何かを正式に発表することさえしていない。」といい、オープンに関して、どんな風にいおうと、Googleが検索と広告の秘密を保持することで言い訳のようになると主張します。その上で、広告主がAdSense経由の収益を細かくデータ化したり、サイト運営者が自分のサイトのおかれている状況をより明確に把握するために、Googleは積極的に検索と広告の中身について、オープンにしていく必要があるとしています。

Cutts氏は、Sullivan氏のコメントに基本的な同意を示し、やや不明瞭ながら、Googleをよりオープンにするために努力するともとれる発言を行っています。

Googleだけでなく、他の検索エンジンも、独自のランキング要素に関して、そのほとんどを明らかにしていません。時折発表されるアルゴリズムに関する情報も、Sullivan氏がいうように、意図的にとでもいえるように不明瞭であったり、時に現場の担当者と実際のアルゴリズムの間に明らかな違いがあったりします。

Sullivan氏がいうように検索エンジンを通じたビジネスが、より多くの市民権を獲得するには、明確なデータを算出し、計画的に運用できるようになることが不可欠です。

「ソースを開示して悪い連中に情報を与える時、同時に彼らと戦って助けてくれる良い連中によって成る軍隊を手にするのだ」というDixon氏の言葉は、一見綺麗事のようにもとられるかも知れませんが、検索エンジンがブラックボックスであり、連日のようにスパム行為によって迷惑を被っている人々がいる中、「良い連中による軍隊」を結成しようという動きが生まれる可能性はあると思いますし、またそれ自体ビジネスになる可能性も完全には否定できないと思います。

先日、当ブログで公開したSmarty氏の記事の翻訳「Googleのアルゴリズムを構成する要素」は、非常に多くの方の興味と関心を呼びました。公開日には、当ブログに対して、通常時に比べて約10倍以上の量のアクセスがありました。誰もがそれだけGoogleのアルゴリズムを知りたいということでしょう。

私は検索エンジンが全てを明らかにせずとも、より積極的にアルゴリズムや、それを構成する要素について発言していくべきだと思います。Googleはもちろんのこと、日本では非常に利用者の多いYahoo!もまたもっと情報を開示できるような取り組みを行って欲しいと願っています。

また、同時に日本でもこの種の議論がもっと活発になってもいいのではないかと思います。これを読まれた皆さんはどのようにお考えでしょうか。