私はhttps://pypi.python.org/pypi/fasttextFastText
で遊んでいます。これは に非常に似ています。まだ組み込み関数が少ないかなり新しいライブラリのようなので、形態学的に似た単語を抽出する方法を考えていました。Word2Vec
例: model.similar_word("dog")
-> 犬。しかし、組み込み関数はありません。
入力すると
model["dog"]
コサインの類似性を比較するために使用される可能性のあるベクトルのみを取得します。
model.cosine_similarity(model["dog"], model["dogs"]])
.
ある種のループを作成cosine_similarity
し、テキスト内の可能なすべてのペアに対して行う必要がありますか? それには時間がかかります...!!!