問題タブ [machine-translation]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
555 参照

perl - moses-SMT システムのトークナイザーが 10 文でもスタックする

ベースラインの MT システムを作ろうとしていました。仕組みを確認するためだけに、ソース (S) とターゲット (T) の言語コーパスをわずか 2000 文で作成しました。最初のステップは、機械翻訳 (MT) システム用のデータを準備することです。このステップでは、まずベースライン SMTで説明されているようにトークン化を実行する必要があります。私はこのコードを使用しました:

( S = フランス語 & T = 英語)

2時間後、まだ動いていることを確認しました。予想外だったので気になりました。それからたった10文でやってみました。驚いたことに、それから 30 分が経過しましたが、まだ実行中です。

私は何か悪いことをしましたか?

PS: OS = Ubuntu 14.04.5 LTS ソニー ウルトラブック デュアル ブートなし。

0 投票する
3 に答える
1160 参照

machine-translation - 文脈に基づいて文の一部を翻訳する

文の一部を翻訳できるようにする必要があるアプリケーションに取り組んでいます。問題は、パーツを Google 翻訳などの翻訳 API に送信すると、翻訳が発生したコンテキストで意味をなさないことが多いことです。例:

彼は建物を出る

を目的の言語に翻訳すると、おそらく「木の葉」のコンテキストで結果が得られますが、これはもちろんこの例では意味がありません。したがって、翻訳は文脈を考慮に入れる必要があります。翻訳文を彼の葉に展開すると、彼のの正しい翻訳が得られます。ただし、探している単語であるleavesの翻訳を失います。

私がこれにどのようにアプローチすべきかについて誰かが考えを持っていますか? Google Translate API は有料 API であるため、API からリクエストする翻訳の量を最小限に抑えたいと考えています。

0 投票する
0 に答える
108 参照

nlp - 最先端の言語翻訳ツールキット

研究のためにスペイン語のツイートを英語に翻訳する必要があります。ツールキットを見つけました。その中で、Mosesはいくつかの研究論文で使用され、他の新しいツールキットはそれらを評価目的のベースラインとして使用しました。なので候補として考えています。また、 Phrsalというスタンフォード大学のツールキットも見つけましたが、これも良さそうです。最後に見つけたのは、有名なnltk図書館のものです。翻訳パッケージもあります。phrase based statistical machine translationそれらのすべてが、他のテクニックと一緒にテクニックを使用したと述べています。さて、私の質問は、実用的または理論的な観点から、ツイートの翻訳に使用するのに最適なものはどれかということです。それともgoogle translator api最善の解決策でしょうか?