ソースからの直接の説明は次のとおりです(ほぼ)
22:03分
見る価値があります!
基本的に、Google の元 CTO である Douglas Merrill によると、次のようになります。
1) Google で (つづりを間違えた) 単語を書きます。
2) 欲しいものが見つからない (結果をクリックしないでください)
3) 単語のつづりが間違っていることに気付き、検索ボックスの単語を書き直します。
4) 欲しいものが見つかります (最初のリンクをクリックします)
このパターンは何百万回も倍増し、最も一般的なスペルミスと最も「一般的な」修正は何かを示しています。
このようにして、Google はほぼ瞬時にすべての言語でスペル修正を提供できます。
また、これは、夜間に誰もが夜を綴り始めた場合、Google が代わりにその単語を提案することを意味します。
編集
@ThomasRutter: Douglas はそれを「統計的機械学習」と表現しています。
彼らは、どのクエリがどのユーザーからのものかを知っているので、誰がクエリを修正したかを知っています (Cookie を使用)
ユーザーがクエリを実行し、ユーザーの 10% だけが結果をクリックし、90% が戻って別のクエリを入力し (修正された単語を使用)、今度は 90% が結果をクリックした場合、ユーザーは見つけたことがわかります。訂正。
また、それらが表示するすべてのリンクの情報を持っているため、それらが 2 つの異なるクエリの「関連する」クエリであるかどうかを知ることもできます。
さらに、スペル チェックにコンテキストが含まれるようになったため、コンテキストに応じて異なる単語を提案することもできます。
このgoogle wave のデモ(@ 44m 06s ) を参照してください。これは、スペルを自動的に修正するためにコンテキストがどのように考慮されるかを示しています。
ここでは、その自然言語処理の仕組みについて説明します。
そして最後に、自動機械翻訳(@ 1h 12m 47s ) をミックスに追加して何ができるかの素晴らしいデモです。
ビデオに分と秒のアンカーを追加して、コンテンツに直接スキップできるようにしました。機能しない場合は、ページをリロードするか、手でマークまでスクロールしてみてください。