テキスト分類の統計的分類子として、scikit-learn の LinearSVCを使用しています。私の機能は中心化されていないtf-idfです。
fit_intercept
属性が に設定されている場合False
、分類精度が大幅に向上します。これは、フィーチャの絶対値が統計分類器のパフォーマンスに影響を与えないという期待に反します。
観察している分類精度の変化の原因は何ですか?
テキスト分類の統計的分類子として、scikit-learn の LinearSVCを使用しています。私の機能は中心化されていないtf-idfです。
fit_intercept
属性が に設定されている場合False
、分類精度が大幅に向上します。これは、フィーチャの絶対値が統計分類器のパフォーマンスに影響を与えないという期待に反します。
観察している分類精度の変化の原因は何ですか?