Weka を使い始めたばかりで、最初のステップに問題があります。
トレーニング セットがあります。
@relationパーセプトロンXOR @属性 X1 数値 @属性 X2 数値 @attribute 出力数値 @データ 1,1,-1 -1,1,1 1,-1,1 -1、-1、-1
私がやりたい最初のステップは、トレーニングしてから、Weka GUI を使用してセットを分類することです。私がこれまでやってきたこと:
Weka 3.7.0 を使用。
- GUI を起動します。
- 冒険者。
- ファイルを開く -> 私の arff ファイルを選択します。
- 分類タブ。
- トレーニング セットのラジオ ボタンを使用します。
- 選択-> 関数>multilayer_perceptron
- 上部の「多層パーセプトロン」テキストをクリックして、設定を開きます。
- 非表示レイヤーを「2」に設定します。(gui が true に選択されている場合は、これが必要な正しいネットワークであることを示しています)。[OK] をクリックします。
- 開始をクリックします。
出力:
=== 運行情報 === スキーム: weka.classifiers.functions.MultilayerPerceptron -L 0.3 -M 0.2 -N 500 -V 0 -S 0 -E 20 -H 2 -R 関係: PerceptronXOR インスタンス: 4 属性: 3 X1 X2 出力 テストモード: トレーニング データで評価する === 分類子モデル (完全なトレーニング セット) === 線形ノード 0 入力の重み しきい値 0.21069691964232443 ノード 1 1.8781169869419072 ノード 2 -1.8403146612166397 シグモイド ノード 1 入力の重み しきい値 -3.7331156814378685 属性 X1 3.6380519730323164 属性 X2 -1.0420815868133226 シグモイド ノード 2 入力の重み しきい値 -3.64785119182632 属性 X1 3.603244645539393 属性 X2 0.9535137571446323 クラス 入力 ノード 0 モデルの構築にかかった時間: 0 秒 === トレーニング セットの評価 === ===まとめ=== 相関係数 0.7047 平均絶対誤差 0.6073 二乗平均平方根誤差 0.7468 相対絶対誤差 60.7288 % 平方根相対二乗誤差 74.6842 % インスタンスの総数 4
0.3 での 500 回の反復でエラーが発生しないのは奇妙に思えますが、5000 @ 0.1 ではエラーが発生するので、そのままにしておきましょう。
次に、テスト データ セットを使用します。
@relationパーセプトロンXOR @属性 X1 数値 @属性 X2 数値 @attribute 出力数値 @データ 1,1,-1 -1,1,1 1,-1,1 -1、-1、-1 0.5、0.5、-1 -0.5,0.5,1 0.5、-0.5、1 -0.5、-0.5、-1
- 「Supplied test set」のラジオボタン
- テスト セット arff を選択します。
- 開始をクリックします。
=== 運行情報 === スキーム: weka.classifiers.functions.MultilayerPerceptron -L 0.1 -M 0.2 -N 5000 -V 0 -S 0 -E 20 -H 2 -R 関係: PerceptronXOR インスタンス: 4 属性: 3 X1 X2 出力 テスト モード: ユーザー提供のテスト セット: サイズ不明 (インクリメンタルに読み取る) === 分類子モデル (完全なトレーニング セット) === 線形ノード 0 入力の重み しきい値 -1.2208619057226187 ノード 1 3.1172079341507497 ノード 2 -3.212484459911485 シグモイド ノード 1 入力の重み しきい値 1.091378074639599 属性 X1 1.8621040828953983 属性 X2 1.800744048145267 シグモイド ノード 2 入力の重み しきい値 -3.372580743113282 属性 X1 2.9207154176666386 属性 X2 2.576791630598144 クラス 入力 ノード 0 モデルの構築にかかった時間: 0.04 秒 === テストセットでの評価 === ===まとめ=== 相関係数 0.8296 平均絶対誤差 0.3006 二乗平均平方根誤差 0.6344 相対絶対誤差 30.0592 % 平方根相対二乗誤差 63.4377 % インスタンスの総数 8
がこれらを正しく分類できないのはなぜですか?
トレーニングデータですぐに局所最小値に達し、それがすべてのケースに適合しないことを「認識」していないという理由だけですか?
質問。
- 500 @ 0.3 が機能しないのはなぜですか? このような単純な問題には奇妙に思えます。
- テストセットで失敗するのはなぜですか。
- 分類するセットを渡すにはどうすればよいですか?