0

私はWEKAを理解しようとしており、私が持っているデータを使っていくつかの実験を行っています.

基本的には、データ セット 1 をトレーニング セットとして使用します。その上で J48 ディシジョン ツリーを実行します。次に、データ セット 2 を取得し、その上でトレーニング済みツリーを実行します。元のデータ セットの出力には、予測が何であったかを示す追加の列が含まれています。

次に、ベイズ ニューラル ネットワークで同じことをもう一度行います。

誰かがこれをどのように正確に達成するかについての詳細な指示のリンクを教えてもらえますか? いくつかの手順が不足しているようで、余分な列を含む元のデータ セットの出力を取得できません。

4

1 に答える 1

1

コマンドラインでそれを行う 1 つの方法を次に示します。この情報は、ソフトウェアに付属の Weka マニュアルの第 1 章 (「コマンドライン入門」) にあります。

java weka.classifiers.trees.J48 -t training_data.arff -T test_data.arff -p 1-N

どこ:

-t <training_data.arff> specifies the training data in ARFF format
-T <test_data.arff> specifies the test data in ARFF format
-p 1-N specifies that you want to output the feature vector and the prediction,
     where N is the number of features in your feature vector.

たとえば、ここではトレーニングとテストの両方に大豆.arff を使用しています。特徴ベクトルには 35 の特徴があります。

Java weka.classifiers.trees.J48 -t 大豆.arff -T 大豆.arff -p 1-35

出力の最初の数行は次のようになります。

=== Predictions on test data ===

 inst#     actual  predicted error prediction (date,plant-stand,precip,temp,hail,crop-hist,area-damaged,severity,seed-tmt,germination,plant-growth,leaves,leafspots-halo,leafspots-marg,leafspot-size,leaf-shread,leaf-malf,leaf-mild,stem,lodging,stem-cankers,canker-lesion,fruiting-bodies,external-decay,mycelium,int-discolor,sclerotia,fruit-pods,fruit-spots,seed,mold-growth,seed-discolor,seed-size,shriveling,roots)
     1 1:diaporth 1:diaporth       0.952 (october,normal,gt-norm,norm,yes,same-lst-yr,low-areas,pot-severe,none,90-100,abnorm,abnorm,absent,dna,dna,absent,absent,absent,abnorm,no,above-sec-nde,brown,present,firm-and-dry,absent,none,absent,norm,dna,norm,absent,absent,norm,absent,norm)
     2 1:diaporth 1:diaporth       0.952 (august,normal,gt-norm,norm,yes,same-lst-two-yrs,scattered,severe,fungicide,80-89,abnorm,abnorm,absent,dna,dna,absent,absent,absent,abnorm,yes,above-sec-nde,brown,present,firm-and-dry,absent,none,absent,norm,dna,norm,absent,absent,norm,absent,norm)

列は次のとおりです。(1) データ インスタンス番号。(2) グラウンド トゥルース ラベル。(3) 予測ラベル。(4) エラー。(5) 予測の信頼性。(6)特徴ベクトル。

于 2013-06-28T21:10:40.673 に答える