問題タブ [torchtext]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
359 参照

nlp - 最近隣検索に Torchtext で annoy を使用する

私はいくつかの NLP タスクに Torchtext を使用しています。具体的には、組み込みの埋め込みを使用しています。

逆ベクトル検索を実行できるようにしたい: ノイズの多いベクトルを生成し、それに最も近いベクトルを見つけてから、ノイズの多いベクトルに「最も近い」単語を取得します。

torchtext docsから、組み込みデータセットに埋め込みをアタッチする方法は次のとおりです。

次に、迷惑インデックスを構築できます。

次に、ノイズの多いベクトルを使用して単語を取得したいとします。

上記の最後の 2 行について質問があります: The ann_indexwas built using enumerateover the embeddingobject, which is a Torch tensor.

オブジェクトには、与えられたインデックスが単語を返す[vocab][2]独自のリストがあります。itos

私の質問は次のとおりです: itos リストに表示される単語の順序が の順序と同じであると確信できますTEXT.vocab.vectorsか? あるインデックスを別のインデックスにマップするにはどうすればよいですか?