weka - wekaを使用してCSVをARFFに変換する

Question

私はこのデータセットhttp://archive.ics.uci.edu/ml/datasets/Communities+and+Crime+UnnormalizedをWekaに取り込もうとしてきましたが、まったく運がありませんでした。それをCSVに変換してから、Wekaにロードしてから、ARFFに変換しようとしましたが、それでもエラーが発生しまし"attribute names are not unique"た。

また、トレーニングデータセットをテストデータセットから拡散する必要がありますか、それとも一緒に保持する必要がありますか？

score 41 · Accepted Answer

ArffViewer を使用することもできます (ツール -> ArffViewer または Ctrl+A)。次に、CSV ファイルを開きます。

次に、[ファイル] -> [名前を付けて保存... ] に移動し、 Arff データファイルを選択します(デフォルトで選択されているはずです)。

フィールドは、セミコロンではなくコンマで区切る必要があることに注意してください。

score 15 · Accepted Answer

WEKA にはいくつかのコンバーターが実装されています。このトピックに関連する API ページは次のとおりです: http://weka.sourceforge.net/doc.stable/weka/core/converters/package-summary.html

たとえば、CSV から ARFF に変換する方法は次のとおりです。

java -cp /path/to/weka.jar weka.core.converters.CSVLoader filename.csv > filename.arff

score 6 · Accepted Answer

.CSV 形式のファイルをこのにアップロードします。そこから、.CSV 形式が WEKA .arff 形式に変換されます。完了したら、.arff ファイルを Weka ツールにフェッチします。これで、データ分析を進めることができます。

score 2 · Accepted Answer

csv にはヘッダーフィールドが必要です。最初の行のcsvファイルにattr0、attr1、...、ラベルを追加する必要があります。

score 1 · Accepted Answer

問題はありませんでした。さて、次のことをしてください。指定したウェブページで、

".arff header for weka: " と "Relevant Papers" の間のセグメントをコピーします。
.txt ファイルに貼り付けます
この場所にあるデータファイルを開きます
インスタンスをコピーし、.txt ファイルの @data セクションの直後に追加します
.txt ファイルを .arff ファイルとして保存します

これで準備完了です。

テストデータセットからトレーニングデータセットを分散する必要がありますか、それとも一緒にしておく必要がありますか?

分類方法によって異なります。10 倍の CV を選択した場合は、そのままにしておきます。慣習的な方法を使用する場合は、それらを分離してください。繰り返しますが、それはすべて方法論に依存します。

score 0 · Accepted Answer

たぶん、このオンライン CSV から ARFF へのコンバーターが役立つでしょうか?

http://slavnik.fe.uni-lj.si/markot/csv2arff/csv2arff.php

weka - wekaを使用してCSVをARFFに変換する

9 に答える 9

Related

Reference