2

Google translate_v3beta1 API による用語集のサポートは、どの程度正確に機能するはずですか? この情報を探していますが、見つかりませんでした。用語集の用語は、他のすべての潜在的な翻訳を単純にオーバーライドする必要がありますか? それとも、用語集の翻訳に優先順位を追加するだけで、エンジンはトレーニング データに「適合する」場合は他の翻訳を引き続き使用できますか?

Python ライブラリを使用して用語集を作成しました (「language_pair」プロパティを使用する tsv と「language_codes_set」プロパティを使用する csv の 2 つの異なる方法を試しました)。次に、用語集を使用して、カスタム MT モデルによって生成されたテキスト文字列内の 1 つの用語の翻訳をオーバーライドしようとしました (つまり、用語集を使用せずに、エンジンが用語を一方的に翻訳し、用語集を使用して強制的に翻訳しようとしました)。その用語には別の翻訳を使用します)、しかし成功しませんでした。

用語集を作成または使用するときに間違いを犯したのか(現在、コードの問題についてはわかりません)、それとも自分の側に間違いがないのかはわかりませんが、トレーニングデータに基づいて、エンジンは単に別の翻訳を使用しました。私が知っているカスタム機械翻訳の他のプラットフォームでの経験から、用語集を使用して翻訳を上書きするものもあれば、用語集の用語に優先順位を付けるためにのみ使用するものもありますが、他のすべての潜在的な翻訳を完全に上書きするわけではありません. したがって、他の考えられる理由、つまりコードが期待どおりに機能しない理由を探す前に、まずこの単純な質問を明確にしたいと思います。

前もって感謝します。

4

1 に答える 1