0

英語の単語埋め込みから非英語 (フランス語、スペイン語、イタリア語) の単語埋め込みを生成するにはどうすればよいですか?

英語以外の単語に対して高品質の単語埋め込みを生成する最良の方法は何ですか?

単語には (samsung-galaxy-s9) が含まれる場合があります

4

2 に答える 2

1

英語の単語埋め込みから非英語 (フランス語、スペイン語、イタリア語) の単語埋め込みを生成するにはどうすればよいですか?

あなたは本当にできません。まったく同じ意味の単語がない限り。王、女王、女性、男性を表すフランス語の単語を知っている場合は、それらの単語に英語でまったく同じ単語を埋め込むことができます。それらは、英語の単語と同じ構文的および意味的特性を示します。しかし、英語の埋め込みを実際に使用して、さまざまな言語の埋め込みを作成することはできません。

英語以外の単語に対して高品質の単語埋め込みを生成する最良の方法は何ですか

英単語と非英語単語は同じように扱うことができます。英語以外の単語を文字列/トークンとして表現し、w2v モデルをトレーニングします。これにはgensimを使用します。必要な言語の膨大なコーパスを見つける必要があります。次に、この巨大なコーパスを使用してモデルを数エポックトレーニングする必要があります。終わり。または、必要な言語で既存のモデルを探します。

単語には (samsung-galaxy-s9) が含まれる場合があります

コーパスに「samsung-galaxy-s9」などの単語が含まれていない限り、モデルはそれが何を意味するのかわかりません。埋め込みを使用したいドメインでより多くの単語を含む可能性のあるコーパスを使用してください。

于 2018-09-20T01:53:21.177 に答える