問題タブ [doc2vec]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - ドキュメントのベクトルを取得しようとすると、gensim KeyError をどのように解決しますか?
次のコードを読んで doc2vec モデルを学習しました。各ドキュメントは、2 行間のテキスト/行として定義されています。
- 手がかりweb09-ja0001-XX-XXXXX
- end_clueweb09-ja0001-XX-XXXXX
これは私のコードです:
しかし、model.docvecs['clueweb09-en0001-01-34238']を書いたときにエラーが発生しましたが、 model.docvecs[0]を書いたときに結果が得られました。
これは私が得たエラーです:
私はpythonとgensimの経験がありません.どうすればこの問題を解決できるか教えてください.
gensim - gensim LabeledSentence と TaggedDocument の違いは何ですか
TaggedDocument
howとLabeledSentence
of gensim
worksの違いを理解するのを手伝ってください。私の最終的な目標は、Doc2Vec
モデルと任意の分類子を使用したテキスト分類です。私はこのブログをフォローしています!
私の質問model_l.docvecs['some_word']
はmodel_t.docvecs['some_word']
? TaggedDocument
どのように動作するかを把握するための優れた情報源のウェブリンクを提供していただけますかLabeledSentence
。
python - Gensim:事前トレーニング済みのdoc2vecモデルをロードする方法は?
事前トレーニング済みの doc2vec モデルを読み込もうとしています:
ただし、読み取り処理中にエラーが表示されます。誰かがこれに対処する方法を提案できますか? エラーは次のとおりです。
gensim - gensim doc2vec で新しいテキストをトレーニングする方法
ビッグデータを使用して doc2vec モデルをトレーニングしたいと考えています。そして、この事前トレーニング済みのモデルを使用して、新しいテキストをトレーニングしたいと考えています。
事前トレーニング済みのモデルを使用して新しいモデルをトレーニングすることのみを期待しています。どうすればできますか?上記のコードは機能しません...
python - Pythonでコーパスファイルを呼び出すには?
私は現在、文の類似性を実装するためにgensim doc2vecモデルに取り組んでいます。
William Bert によるこのサンプル コードに出くわしました。彼は、このモデルをトレーニングするには、独自のバックグラウンド コーパスを提供する必要があると述べています。便宜上、コードを以下にコピーします。
コード内のどこに、どのように独自のコーパスを提供すればよいですか?
よろしくお願いします。
gensim - doc2vec モデルから語彙サイズを取得する方法はありますか?
私は gensim を使用していますdoc2vec
。doc2vec から語彙サイズを知る効率的な方法があるかどうか知りたいです。総単語数を数えるのも大まかな方法ですが、データが膨大な場合 (1GB 以上) は効率的ではありません。