問題タブ [countvectorizer]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - python sklearn 単純ベイズ学習のためのカウント機能以上のものを使用
まず第一に、私は python と nlp / 機械学習が初めてです。今、私は次のコードを持っています:
これは実際にはかなりうまく機能します。を介してスパース マトリックスを取得してCountVectorizer
おりclassifier
、ターゲットと同様にマトリックスを利用しています(0,2,4)
。
ただし、単語数だけでなく、ベクトルでより多くの機能を使用したい場合はどうすればよいでしょうか? 私はそれを見つけることができないようです。前もって感謝します。
scikit-learn - GridSearch の最適な推定器のベクトライザーによって使用される語彙へのアクセス
タイトルに最適なものを知りませんでした。
これが私がやろうとしていることです:私は分類子を訓練するためGridSearch
に a を使用しています。最高の推定器が使用するをpipeline
見たいと思います。vocabulary_.items()
CountVectorizer
今、私は実行した後、これをやっていますGridSearch
:
fit_transform
で再度使用せずに、語彙項目を直接取得する方法はありますCountVectorizer
か?