問題タブ [countvectorizer]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

316 問題

0 投票する

0 に答える

909 参照

scikit-learn - ドキュメントを scikit-learn の CountVectorizer に追加しますか?

CountVectorizer を使用して、事前に生成されたマトリックスにドキュメントを追加したいと考えています。

ここで、別の文字列「3 番目の文字列」をwords_matrixに追加します。マトリックスの拡張 - 次のようなもの:

しかし、すべてを fit_transform しないと機能しません。

2017-04-21T14:51:48.283

0 投票する

1 に答える

214 参照

python - 既存の行列から特徴ベクトルを取得する

Scikit-learn を使用して CountVectorizer オブジェクトを構成し、 (可変長の) nセンテンスの行列Mをfit_transform 関数に渡すと、たとえば n グラム表現Fを取得できます。このような：

これはうまくいきます。max_features を 2000 に設定したため、 Fの形状は (2000, n ) になります。

しかし、もう 1 つの文を取得し、 Fの機能と一致し、同じ長さ (2000) を持つベクトルを生成したいとしましょう。それに新しい文を追加してから、すべての機能を再生成しますか?

python scikit-learn n-gram countvectorizer

2017-04-28T20:08:46.857

1 2 3 4 5 6 7 8 9 10

問題タブ [countvectorizer]

scikit-learn - ドキュメントを scikit-learn の CountVectorizer に追加しますか?

python - 既存の行列から特徴ベクトルを取得する

Reference