ローカリゼーション ワークフローに組み込むことができるオープン ソースの機械翻訳エンジンを探しています。以下のオプションを検討しています。
これらの中で、Moses はコミュニティのサポートが最も広く、多くのローカリゼーション企業や研究者によって試されてきました。私たちのアプリケーションはすべて Java で作成されているため、実際には Java ベースのエンジンに傾倒しています。Joshua または Phrasal をワークフローの一部として使用した人はいますか。あなたの経験を彼らと共有していただけますか?それとも、提供する機能と統合の容易さの点で、Moses はこれらよりもはるかに進んでいますか。
また、エンジンが以下をサポートする必要があります。
- ドメイン固有のトレーニング (つまり、入力データが属するドメインごとに個別のフレーズ テーブルを維持する必要があります)。
- 増分トレーニング (つまり、新しいトレーニング データを使用するたびにモデルを最初から再トレーニングする必要がなくなります)。
- 翻訳プロセスの並列化。