単語ベクトルを作成するには? 単語ベクトルを作成するために 1 つのホット キーを使用しましたが、非常に巨大であり、同様のセマンティック ワードに対して一般化されていません。そこで、ニューラルネットワークを使って単語の類似性や単語ベクトルを見つける単語ベクトルについて聞いたことがあります。だから私はこのベクトル(アルゴリズム)を生成する方法、または単語ベクトルの作成を開始するための良い素材を知りたかったのですか?
質問する
11430 次
2 に答える
3
あなたが言っているのは Word2Vec ( https://code.google.com/p/word2vec/ ) だと思います。指定されたコーパスに基づいて、ドキュメントの N 次元の単語ベクトルをトレーニングします。したがって、word2vec についての私の理解では、ニューラル ネットワークは、ドキュメント ベクトルの次元を集約し、単語間の関係をキャプチャするために使用されます。しかし、これは実際には意味的に関連しているわけではなく、トレーニング ボディの構造的な関係を反映しているだけであることに注意してください。
セマンティックな関連性を把握したい場合は、WordNet ベースの対策を調べてください。たとえば、次のライブラリが実装されています。
word2vec を使い始めるには、事前トレーニング済みのベクトルを使用できます。これに関するすべての情報はhttps://code.google.com/p/word2vec/にあります。
Java 実装を探すとき。これは良い出発点です: http://deeplearning4j.org/word2vec.html
これが役立つことを願っています
幸運をお祈りしています
于 2014-12-19T11:05:08.500 に答える