問題タブ [word-embedding]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
tensorflow - 単語をベクトル化するときにテキスト文字列内の数値を処理する方法は?
ベクトル化するテキスト文字列がある場合、その中の数値をどのように処理すればよいですか? または、ニューラル ネットワークに数字と単語を入力する場合、どうすれば数字を数字として保持できますか?
私はすべての単語の辞書を作成することを計画しています (ここで提案されているように)。この場合、すべての文字列は数値の配列になります。数字である文字をどのように処理すればよいですか? 単語インデックスと数字文字を混在させないベクトルを出力する方法は?
数値を文字列に変換すると、ネットワークに供給する情報が弱まりますか?
word-embedding - どのように埋め込むベクトル単語埋め込み?
「情報検索におけるニューラル ワード埋め込みの統合と評価」という論文を読みました。
ソースコードを理解しようとしましたが、vectors_ap8889_skipgram_s200_w20_neg20_hs0_sam1e-4_iter5 という名前のファイルを開こうとしました。
次のような単語ベクトル表現を見つけました: ダウンタウン "-0.465147 -0.049099 -0.023432 0.058986 -0.085395 -0.027324 -0.050315 .......................... …………」
お願いします; これらの値が何を意味し、どの用語がコーパスで参照されているか、どのように取得できるかを説明する必要があります.