統計的機械翻訳がどのように機能するかについて、高レベルの適切な説明を見つけようとしています。つまり、アラインされていない英語、フランス語、ドイツ語のテキストのコーパスがあるとしたら、それを使用して、ある文をある言語から別の言語に翻訳するにはどうすればよいでしょうか? 自分で Google 翻訳を構築しようとしているわけではありませんが、Google 翻訳がどのように機能するかをより詳細に理解したいと思っています。
検索された Google を見たことがありますが、良いものは何も見つかりませんでした。理解するには高度な数学の知識がすぐに必要であるか、一般化されすぎています。ウィキペディアの SMT に関する記事は両方のようで、あまり役に立ちません。これが非常に複雑な領域であり、すべての数学なしでは理解できないとは思えません。
そのようなシステムがどのように機能するかについて、プログラマーを対象とした一般的なステップバイステップの説明を提供または知っている人はいますか (したがって、コード例は問題ありません)。または、このような本も素晴らしいでしょう。
編集: 私が探しているものの完璧な例は、Peter Norvig のスペル修正に関するすばらしい記事に相当する SMTです。これにより、レーベンシュタイン/サウンドデックス/平滑化アルゴリズムなどの詳細な数学に立ち入ることなく、スペルチェッカーの作成に何が関係しているかについての良いアイデアが得られます...