21

私はこのデータセットhttp://archive.ics.uci.edu/ml/datasets/Communities+and+Crime+UnnormalizedをWekaに取り込もうとしてきましたが、まったく運がありませんでした。それをCSVに変換してから、Wekaにロードしてから、ARFFに変換しようとしましたが、それでもエラーが発生しまし"attribute names are not unique"た。

また、トレーニングデータセットをテストデータセットから拡散する必要がありますか、それとも一緒に保持する必要がありますか?

4

9 に答える 9

41

ArffViewer を使用することもできます (ツール -> ArffViewer または Ctrl+A)。次に、CSV ファイルを開きます。

次に、[ファイル] -> [名前を付けて保存... ] に移動し、 Arff データ ファイルを選択します(デフォルトで選択されているはずです)。

フィールドは、セミコロンではなくコンマで区切る必要があることに注意してください。

于 2013-10-08T09:29:56.307 に答える
15

WEKA にはいくつかのコンバーターが実装されています。このトピックに関連する API ページは次のとおりです: http://weka.sourceforge.net/doc.stable/weka/core/converters/package-summary.html

たとえば、CSV から ARFF に変換する方法は次のとおりです。

java -cp /path/to/weka.jar weka.core.converters.CSVLoader filename.csv > filename.arff
于 2013-01-15T16:56:12.850 に答える
6

.CSV 形式のファイルをこのにアップロードします。そこから、.CSV 形式が WEKA .arff 形式に変換されます。完了したら、.arff ファイルを Weka ツールにフェッチします。これで、データ分析を進めることができます。

于 2014-11-29T13:32:57.970 に答える
2

csv にはヘッダー フィールドが必要です。最初の行のcsvファイルにattr0、attr1、...、ラベルを追加する必要があります。

于 2016-03-04T03:43:09.293 に答える
1

問題はありませんでした。さて、次のことをしてください。指定したウェブページで、

  • ".arff header for weka: " と "Relevant Papers" の間のセグメントをコピーします。
  • .txt ファイルに貼り付けます
  • この場所にあるデータ ファイルを開きます
  • インスタンスをコピーし、.txt ファイルの @data セクションの直後に追加します
  • .txt ファイルを .arff ファイルとして保存します

これで準備完了です。

テスト データセットからトレーニング データセットを分散する必要がありますか、それとも一緒にしておく必要がありますか?

分類方法によって異なります。10 倍の CV を選択した場合は、そのままにしておきます。慣習的な方法を使用する場合は、それらを分離してください。繰り返しますが、それはすべて方法論に依存します。

于 2012-05-01T05:04:07.923 に答える
0

たぶん、このオンライン CSV から ARFF へのコンバーターが役立つでしょうか?

http://slavnik.fe.uni-lj.si/markot/csv2arff/csv2arff.php

于 2013-05-02T13:12:19.643 に答える