0

私は WEKA と ML にまったく慣れていないので、次の点で私の無知を許してください。私はそれを理解しようとして数時間を無駄にしたので、うまくいけば誰かが私を正しい方向に向けることができます:

USDJPY のデータで J48 ディシジョン ツリーを実行しようとしています。データは .csv ファイルを介してロードされ、クラス値は公称型であり、より具体的には、USDJPY が 20 セッション後に 1% 以上高く取引された場合の TRUE または FALSE の値です。問題は、アルゴリズムを実行すると、デシジョン ツリーが単にクラス値を使用して問題を解決しているだけで、役に立たないことです。クラス属性を予測しようとしているクラス属性以外に *22 の属性があります。

私のデータセットを例の「ガラス」データセットと比較すると、私の問題を説明する 2 つの違いが見つかりません。"glass.arff" は、J48 を (同じ設定で) 実行すると、他の属性を介してクラス値 (ガラスの種類) を予測しようとする (つまり、いくつかの推測が間違っている) と期待どおりに機能します。

ここで何が欠けていますか?属性のリストは次のとおりです。

@ATTRIBUTE date NUMERIC
@ATTRIBUTE open NUMERIC
@ATTRIBUTE high NUMERIC
@ATTRIBUTE low NUMERIC
@ATTRIBUTE close NUMERIC
@ATTRIBUTE 1daypctchg NUMERIC
@ATTRIBUTE smavg50onclose NUMERIC
@ATTRIBUTE smavg100onclose NUMERIC
@ATTRIBUTE smavg200onclose NUMERIC
@ATTRIBUTE ubb2 NUMERIC
@ATTRIBUTE bollma2 onclose NUMERIC
@ATTRIBUTE lbb2 NUMERIC
@ATTRIBUTE bollwjpybgn NUMERIC
@ATTRIBUTE %bjpybgn NUMERIC
@ATTRIBUTE rsi NUMERIC
@ATTRIBUTE ma50>100 {FALSE,TRUE}
@ATTRIBUTE ma50>200 {FALSE,TRUE}
@ATTRIBUTE ma100>200 {FALSE,TRUE}
@ATTRIBUTE up1pct5d? {FALSE,TRUE}
@ATTRIBUTE up1pct20d? {FALSE,TRUE}
@ATTRIBUTE dwn1pct5d? {FALSE,TRUE}
@ATTRIBUTE dwn1pct20d? {FALSE,TRUE}
4

1 に答える 1

1

Weka (およびその J48 実装) は、グラウンド トゥルース ク​​ラスが一貫して .csv ファイルの同じ列にある限り、データを分類できるはずです。

于 2016-09-17T22:40:10.987 に答える