1

リモート センシング データの土地被覆分類のために、数週間前に Weka を使い始めたばかりです。私はデータ マイニングの専門家ではありませんが、今まではすべてが適切に機能していました。ちなみに、私はcmd(.batファイル)でWekaを使用しています。

また、私の問題がウェブ全体にまったく存在しないように見えるため、今は少し無力です。私の問題は、予測データに 1 つのクラスが欠落していることですが、以前は検証プロセス中に正しく分類されていました (少なくともいくつかのインスタンスでは)。それは可能ですか?なぜ?より具体的に:

http://weka.wikispaces.com/Making+predictionsに示されているように、weka.filters.supervised.attribute.AddClassificationを使用して RandomForest 予測を行いました。. 以前、トレーニング セットで分類器をトレーニングし、別のテスト セットで検証しました (63 個の特徴、トレーニング: ~300.000 インスタンス、検証: ~ 100.000 インスタンス)。私は13の異なるクラスを持っています。すべてのクラスが満足のいく精度を示すわけではありませんが、TP 率と精度は決してゼロではありません。このプロセスで生成された .model ファイルは、上記の予測で読み込まれました。私の「予測セット」には膨大な量のデータが含まれています (〜 16 Mio のラスタースタック。ピクセルのため、arff-Conversion 中に分割されます)。トレーニング セットと同様に、テスト セットはこの予測セットの一部です。しかし、結果の分類には1つを除くすべてのクラスが含まれています...私は完全に間違っていますか、それとも結果にすべてのクラスを含める必要がありますか?少なくとも検証領域では? または別の質問: weka.classifiers.trees の結果をすべきではありません。(モデルの構築と検証、テスト インスタンスを使用) とweka.filters.supervised.attribute.AddClassification (モデルの読み込みと予測、同じインスタンスを使用) は、理論的には同じですか?

私のトレーニングコード:

java -Xmx6000m -classpath "C:\Program Files\Weka-3-6\weka.jar" weka.classifiers.trees.RandomForest ^
-t xx\trainingset.arff ^
-T xx\testset.arff ^
-d xx\modelfile.model ^
-i ^
 > xx\output.txt

私の予測コード:

java -Xmx6000m -classpath "C:\Program Files\Weka-3-6\weka.jar" weka.filters.supervised.attribute.AddClassification ^
-serialized xx\modelfile.model ^
-classification ^
-i xx\arfffile_tile1.arff ^
-remove-old-class ^
-o xx\classified_tile1.arff ^
-c last ^
-distribution

混乱していないことを願っています...最後の質問に関しては、現在テスト実行用のデータを準備しており、それについてお知らせしますが、これにはしばらく時間がかかります...アイデアや提案は大歓迎です. :) たぶん、私もこのWeka全体について完全に混乱し、明らかな間違いを見逃していますか?

4

0 に答える 0