python - 既存の行列から特徴ベクトルを取得する

翻译自：https://stackoverflow.com/questions/43688177 2017-04-28T20:08:46.857

214 次

Scikit-learn を使用して CountVectorizer オブジェクトを構成し、 (可変長の) nセンテンスの行列Mをfit_transform 関数に渡すと、たとえば n グラム表現Fを取得できます。このような：

vectorizer = CountVectorizer(min_df = 1,
                             max_features = 2000,
                             ngram_range = (2, 2),
                             analyzer="word)

F = vectorizer.fit_transform(A)

これはうまくいきます。max_features を 2000 に設定したため、 Fの形状は (2000, n ) になります。

しかし、もう 1 つの文を取得し、 Fの機能と一致し、同じ長さ (2000) を持つベクトルを生成したいとしましょう。それに新しい文を追加してから、すべての機能を再生成しますか?

python - 既存の行列から特徴ベクトルを取得する

1 に答える 1

Related

Reference