scikit について新たな質問があります。
分類問題、推定量としてのロジスティック回帰。私は自分の機能を備えた X データセットを持っています。
クロス検証を通じてアルゴリズムを使用したいのですが、2 つの方法があります。データセットを手動で 5 つのサブセットに分割し、最後に 5 回反復して、毎回異なるセットをテスト用に残します。スコアを取得しましたが、今必要なのは、新しいデータセットを予測するために推定器で使用する係数の平均です。係数をscikitロジスティック回帰推定器に渡すことが可能であることをstackoverflowのどこかで読みました。
それ以外の場合は、次を使用しますcross_val_score
。
lrmodel=LogisticRegression(penalty='l2',C=1)
cv.cross_val_score(lrmodel, Xf, y, cv=5,scoring='log_loss', verbose=0)
クロス検証推定後のクロスエントロピーを教えてくれます。しかし、平均係数を使用し、新しいまだラベル付けされていないデータセットの新しい予測に推定量を使用したい場合はどうなるでしょうか?
ありがとうございました!