0

この人としてのwekaについて質問があります:

こんにちは、みんな:

私はこれについてWEKAについて本当に奇妙に感じました。

欠測値が多いCSVファイルを用意しました。このファイルで欠落している値の1つは基本的なものであり、コンマのペア、つまり、random_value1,,random_value2の間に値はありません。これはフォーマットの例です。カンマのペアがあり、それらの間に空白がなくても何もないことがわかります。これは、データの値が欠落していることを示しているはずです。

奇妙なことに、このCSVをWEKAに読み込むと、WEKAは欠落しているすべての値を疑問符(つまり「?」)に割り当てます。これがまさにWEKAの表現です。

そして、テスト分析を実行すると、WEKAはこれらの「?」に取り組み始めました。ある種の有用な情報として。値が欠落しているだけですが、WEKAはそれを飛び越えてください。

これらの問題は本当に無駄になりました。分析結果は、欠落している場合は値が欠落している、欠落しているものは欠落している、欠落している相関関係が欠落している場合のように読み取られます。

WEKAは、欠落している値を、ある種の疑問符ではなく、欠落している値として読み取ることができますか?または、WEKAにすべての「?」について、それらを欠測値として扱うように指示できますか?

みんなありがとう

彼はこの解決策を使用して問題を解決しました。

私は行方不明についてWEKAに伝える方法を見つけました。ASCIIエディタのfine_and_replace関数を使用して、すべての「?」を置き換えます。に ?。

>>

しかし、ASCIIエディタをダウンロードして使用する方法がわかりませんでした。

4

2 に答える 2

2

Windowsではnotepad2またはnotepad++を使用することをお勧めします。

于 2012-03-23T06:43:56.340 に答える
0

欠落している値を処理する必要はありません。欠落している値に対しては、アルゴリズムが異なれば動作も異なります。ですから、心配しないでください。本来の方法で処理されます。

于 2012-03-30T02:58:44.510 に答える