3

文の一部を翻訳できるようにする必要があるアプリケーションに取り組んでいます。問題は、パーツを Google 翻訳などの翻訳 API に送信すると、翻訳が発生したコンテキストで意味をなさないことが多いことです。例:

彼は建物を出る

を目的の言語に翻訳すると、おそらく「木の葉」のコンテキストで結果が得られますが、これはもちろんこの例では意味がありません。したがって、翻訳は文脈を考慮に入れる必要があります。翻訳文を彼の葉に展開すると、彼のの正しい翻訳が得られます。ただし、探している単語であるleavesの翻訳を失います。

私がこれにどのようにアプローチすべきかについて誰かが考えを持っていますか? Google Translate API は有料 API であるため、API からリクエストする翻訳の量を最小限に抑えたいと考えています。

4

3 に答える 3

7

文脈なしに翻訳するのは絶望的だと指摘するのは正しい.

Google Translate API は、Chrome 統合と同様に、HTML タグに対応しています (デフォルトのパラメーターには が含まれますformat=html)。

そのため、関心のある単語や語句を HTML タグでラップするのが 1 つの良い方法です。

コンソールでこれを試すことができます:

ここに画像の説明を入力

HTML タグのコンテンツを解析してバックアウトするのは簡単なはずです。

注 1 :
消費者向けのスタンドアロンの Google 翻訳 UI では、このオプションは公開されていません。試すには、API コンソールまたはプログラムで翻訳するか、Chrome でページを翻訳する必要があります。

注 2 :
翻訳の単語は本質的に 1:1 ではないため、多少のニュアンスがあります。単語が 2 つの単語になることもあれば、ターゲット言語で単語が null 表現になることもあります。

1:2 の例:
en: He <span>left</span> the building.
it: Ha <span>lasciato</span> l'edificio.
[おそらく、haも含まれているはずです。]

1:0 例:
en: How <span>are</span> you?
ru: Как вы?
[ to beは通常、ロシア語では省略されます。]
en: How are <span>you</span>?
it: Come stai?
[代名詞は、イタリア語ではしばしば省略されます。]

2:1 の例:
en: He is always <span>screwing</span> things up.
it: Sempre <span>spiegazza</span> le cose.
[英語やその他の言語には、分離可能な動詞があります。ここでの実際の入力は、ねじ込むことではなく、ねじ込むことです。]

あなたにとってこれは多少の作業ですが、実際には非常に有用な情報でもあります。とにかく、 lasciato を処理して正しい lemma lasciare を取得する方が簡単です

その他のパラメータ ドキュメントについては、 cloud.google.com/translate/docs/reference/restを参照してください。

于 2016-12-16T06:55:58.930 に答える
1

私の考え:

「彼は去る」を送信し、どの部分が「彼」でどの部分が「葉」であるかを理解するために、「葉」のすべての可能な翻訳と交差します (すべての単語のすべての可能な翻訳のバイリンガル辞書をローカルに保管してください)

于 2016-12-15T17:29:14.407 に答える