language-agnostic - 統計的機械翻訳の適切な説明は何ですか?

Question

統計的機械翻訳がどのように機能するかについて、高レベルの適切な説明を見つけようとしています。つまり、アラインされていない英語、フランス語、ドイツ語のテキストのコーパスがあるとしたら、それを使用して、ある文をある言語から別の言語に翻訳するにはどうすればよいでしょうか? 自分で Google 翻訳を構築しようとしているわけではありませんが、Google 翻訳がどのように機能するかをより詳細に理解したいと思っています。

検索された Google を見たことがありますが、良いものは何も見つかりませんでした。理解するには高度な数学の知識がすぐに必要であるか、一般化されすぎています。ウィキペディアの SMT に関する記事は両方のようで、あまり役に立ちません。これが非常に複雑な領域であり、すべての数学なしでは理解できないとは思えません。

そのようなシステムがどのように機能するかについて、プログラマーを対象とした一般的なステップバイステップの説明を提供または知っている人はいますか (したがって、コード例は問題ありません)。または、このような本も素晴らしいでしょう。

編集: 私が探しているものの完璧な例は、Peter Norvig のスペル修正に関するすばらしい記事に相当する SMTです。これにより、レーベンシュタイン/サウンドデックス/平滑化アルゴリズムなどの詳細な数学に立ち入ることなく、スペルチェッカーの作成に何が関係しているかについての良いアイデアが得られます...

score 3 · Accepted Answer

The Atlantic Online は、1998 年 12 月に、統計的機械翻訳について非常に率直で非技術的な説明を掲載していました。

ロスト・イン・トランスレーションby Stephen Budiansky

私は以前、統計的 MT に関する非技術的なものを読んだことがありますが、常に疑問に思っていました。この記事は実際にその答えを示しており、単純明快で、非常に驚きました。

score 3 · Accepted Answer

これは素晴らしいビデオ講義です（2部構成）：

http://videolectures.net/aerfaiss08_koehn_pbfs/

詳細については、次の本を強くお勧めします。

http://www.amazon.com/Statistical-Machine-Translation-Philipp-Koehn/dp/0521874157

どちらも、研究で最も広く使用されている MT システムを作成した人物のものです。それはすべての基本的なことをカバーし、非常によく説明され、正確です. これはおそらく、この分野を始めた研究者が読むべき事実上の標準書の 1 つです。

score 0 · Accepted Answer

Google Developer Day 2007 での Peter Norvig の講演、Theorizing from Data: Avoiding the Capital Mistakeには、統計機械翻訳の原理に関するアクセス可能な高レベルの説明が含まれています (約 21:20 から)。

language-agnostic - 統計的機械翻訳の適切な説明は何ですか?

3 に答える 3

Related

Reference