Weka GUI を使用して、オンライン投稿で NaiveBayes 分類子を実行しています。機能を改善する方法をさらに学ぶことができるように、誤って予測されたインスタンス (オンライン投稿) を追跡しようとしています。
現在、これを行うための回避策があります。一意の ID を含むデータを生成し、Weka にインポートするときに一意の ID を削除します。次に、予測結果を .arff ファイルに保存する予測アペンダーをアタッチします。ファイルを読んで、パフォーマンスの悪いインスタンスを見つけました。誤って分類されたインスタンスについては、各インスタンスに十分に一意の値を与える特定の特徴値を使用し、一意の ID を含む元のデータから同じ値を持つインスタンスを見つけます。ご覧のとおり、これは本当に時間のかかるプロセスです。
分類器を実行するときにデータの一部として保持しながら、私の場合はインスタンスの一意の ID である機能を無視する方法があるかどうかを知りたいです。
ありがとうございました。