問題タブ [doc2vec]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
551 参照

python - ドキュメントのベクトルを取得しようとすると、gensim KeyError をどのように解決しますか?

次のコードを読んで doc2vec モデルを学習しました。各ドキュメントは、2 行間のテキスト/行として定義されています。

  • 手がかりweb09-ja0001-XX-XXXXX
  • end_clueweb09-ja0001-XX-XXXXX

これは私のコードです:

しかし、model.docvecs['clueweb09-en0001-01-34238']を書いたときにエラーが発生しましたが、 model.docvecs[0]を書いたときに結果が得られました。

これは私が得たエラーです:

私はpythonとgensimの経験がありません.どうすればこの問題を解決できるか教えてください.

0 投票する
1 に答える
4053 参照

gensim - gensim LabeledSentence と TaggedDocument の違いは何ですか

TaggedDocumenthowとLabeledSentenceof gensimworksの違いを理解するのを手伝ってください。私の最終的な目標は、Doc2Vecモデルと任意の分類子を使用したテキスト分類です。私はこのブログをフォローしています!

私の質問model_l.docvecs['some_word']model_t.docvecs['some_word']? TaggedDocumentどのように動作するかを把握するための優れた情報源のウェブリンクを提供していただけますかLabeledSentence

0 投票する
1 に答える
2570 参照

python - Gensim Doc2Vec Exception AttributeError: 'str' オブジェクトに属性 'words' がありません

Doc2Vecライブラリからモデルを学習gensimし、次のように使用しています。

入力dirnameは、簡単にするために、各ファイルが 100 行を超える 2 つのファイルのみを含むディレクトリ パスです。次の例外が発生しています。

出力

また、printステートメントを使用すると、イテレータがディレクトリを 6 回反復したことがわかりました。これはなぜですか?

どんな種類の助けもいただければ幸いです。

0 投票する
1 に答える
1578 参照

python - Gensim:事前トレーニング済みのdoc2vecモデルをロードする方法は?

事前トレーニング済みの doc2vec モデルを読み込もうとしています:

ただし、読み取り処理中にエラーが表示されます。誰かがこれに対処する方法を提案できますか? エラーは次のとおりです。

0 投票する
0 に答える
1743 参照

gensim - gensim doc2vec で新しいテキストをトレーニングする方法

ビッグデータを使用して doc2vec モデルをトレーニングしたいと考えています。そして、この事前トレーニング済みのモデルを使用して、新しいテキストをトレーニングしたいと考えています。

事前トレーニング済みのモデルを使用して新しいモデルをトレーニングすることのみを期待しています。どうすればできますか?上記のコードは機能しません...

0 投票する
0 に答える
824 参照

python - Pythonでコーパスファイルを呼び出すには?

私は現在、文の類似性を実装するためにgensim doc2vecモデルに取り組んでいます。

William Bert によるこのサンプル コードに出くわしました。彼は、このモデルをトレーニングするには、独自のバックグラウンド コーパスを提供する必要があると述べています。便宜上、コードを以下にコピーします。

コード内のどこに、どのように独自のコーパスを提供すればよいですか?

よろしくお願いします。

0 投票する
3 に答える
6012 参照

gensim - doc2vec モデルから語彙サイズを取得する方法はありますか?

私は gensim を使用していますdoc2vec。doc2vec から語彙サイズを知る効率的な方法があるかどうか知りたいです。総単語数を数えるのも大まかな方法​​ですが、データが膨大な場合 (1GB 以上) は効率的ではありません。