各カテゴリに 100 個のドキュメントがある 20NewsGroup データセットのテキスト分類に取り組んでいます。10 倍の交差検証を使用して Naive Bayes を介してテキスト ドキュメントを分類します。正常に実行され、最後に結果が得られます。
10倍のクロス検証を使用してKNNで同じことを試みましたが、常に「プロセスの失敗」で終わり、利用可能なメモリよりも多くのメモリが必要であることを示しています。build.xmlとrapidminerGUI.batでrapidminerのヒープスペースを1GBから2.5Gに増やしましたが、何も改善されず(ヒープスペースは問題ではないと思います)、常により多くのメモリを要求することになります。
親切に助けてください、私はそれに行き詰まり、考えられるすべての可能なオプションを試しました
プラットフォームの詳細:
OS: Windows 7 (64 ビット) ソフトウェア バージョン: Rapidminer 5.3 (64 ビット) Java: Java 1.7 (64 ビット)