問題タブ [countvectorizer]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
scikit-learn - ドキュメントを scikit-learn の CountVectorizer に追加しますか?
CountVectorizer を使用して、事前に生成されたマトリックスにドキュメントを追加したいと考えています。
ここで、別の文字列「3 番目の文字列」をwords_matrixに追加します。マトリックスの拡張 - 次のようなもの:
しかし、すべてを fit_transform しないと機能しません。
python - 既存の行列から特徴ベクトルを取得する
Scikit-learn を使用して CountVectorizer オブジェクトを構成し、 (可変長の) nセンテンスの行列Mをfit_transform 関数に渡すと、たとえば n グラム表現Fを取得できます。このような:
これはうまくいきます。max_features を 2000 に設定したため、 Fの形状は (2000, n ) になります。
しかし、もう 1 つの文を取得し、 Fの機能と一致し、同じ長さ (2000) を持つベクトルを生成したいとしましょう。それに新しい文を追加してから、すべての機能を再生成しますか?