私は、 scikit-learn を使用して教師あり学習のマルチクラステキスト分類を実行しているかなり限られたデータ セットを持っています。情報の不足を少し緩和するために、次のことを行いたいと思いました。
分類したいコンテンツからngramを抽出し、コンテンツのユニグラムとマージして分類を行う
投票ベースのアンサンブル分類器を実装 (または既存の実装を使用) して、分類の精度を向上させます。たとえば、多項ベイズと KNN はどちらも、さまざまなクラスで良い結果をもたらすようです。データセット。
最初のステップは些細なことですが、scikit-learn を使用してアンサンブル分類を行う方法についてはあまりわかりません。scikit-learn には、このようなアンサンブル クラスに関するいくつかのエントリがあることに注意しましたが、探しているものとはまったく異なります。
scikit-learn を使用してこれを行う具体的な例を知っている人はいますか?