問題タブ [arff]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - ID3 ディシジョン ツリーで属性の数値を持つ最適なノードを選択する
次のコードがあります。最適な属性を選択するための属性に数値がない場合、正しく機能します。ただし、年齢属性などの属性に数値がある場合、コードを修正して機能させる方法がわかりません。
これが私が使用しているデータです。.arff 形式です。
また、これは私がウェブで見つけたarffパーサーで、正常に動作します。私は同じディレクトリに入れました:
weka - wekaでArffファイルを読み込めません
Weka で Arff を開こうとしていますが、2 つのエラーが発生します。
1 つ目は、ファイルが「Arff データ ファイル」として認識されないことです。理由: トークン [EOL]、行 3267 のファイル読み取りの早期終了。
さらに、値が「?」のない「コンバーターを使用」をクリックすると、
2 番目のエラーは、csvloader を読み込めませんでした。理由: 値の数が間違っています。読み取り値は 2、予想される値は 1、読み取りトークン [EOF]、3267
ファイルは次のとおりです。
awk - 疎行列データを WEKA の arff ファイル形式に変換する方法は?
多くの数値を含む疎行列 .txt ファイルがありますが、ほとんどは 0 です。この .txt ファイルのサンプルを次に示します。
0 0 0.271178 0 0 0 0.538776 0 -0.631228 0 0 -0.501485 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.438643 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 -0.498918 0 0 0 0 0 0 0 0.475561 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.370479 0 -0.300765 0 -1.10987 0 0 0.163637 0 0 0 0 0 0 0 0 0 0 0.304006 0 0.181697 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 -0.261758 0 0 0 0.153415 0.17412 0 -0.129725 0 0.17598 0 0 0 0 0 0 0 0 6 0 0 5 0.5 -0.211302 0 0 0 0 0 0 0.213277 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.0698458 0 0 0 0.661972 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.376654 0 0 -0.604655 0 0 0 0 0 0 0 0 0.301025 0 0 -0.431324 0 0 -0.139445 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.404718 0.610013 -0.286108 0 0.46045 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 -0.193543 0 0 0 0 0 0 0.315063 0 0 -0.285598 0 0 0.206607 0139445 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.404718 0.610013 -0.286108 0 0.46045 0 0 0 0 0 -0.193543 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 6 7 0 8 2 8139445 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0.404718 0.610013 -0.286108 0 0.46045 0 0 0 0 0 -0.193543 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 6 7 0 8 2 8
私がしなければならないことは、このファイルを調べて、データをWEKA の 認識可能なファイル形式である .arff に変換できるようにすることです。これにより、データ セットに対してデータ マイニング アルゴリズムを実行できるようになります。誰もこれを行う方法を知っていますか? 私の問題に似た StackOverflow でいくつかの同様の質問を見つけましたが、それらは AWK 言語のスクリプトを使用しており、以前に .awk プログラムを使用したことがないため、それらのプログラムを正しく実行できませんでした。これらの投稿へのリンクは次のとおりです: 1 2
csv - ARFF ファイルの「データ」セクションでは、コンマの代わりにスペースを使用できますか?
以下のように、表形式の属性を持つ大規模なデータセットがあります
これらの値を ARFF ファイルのデータ セクションに入力して、機械学習用の weka ソフトウェアで分析する必要があります。ただし、arff がサポートする通常の形式は次のとおりです。
属性はカンマ区切りです。arff には常にコンマが必要ですか、それともスペースまたはタブで区切っても問題ありませんか?
csv - .txt ファイルを arff に変換する
各行にツイートが含まれるテキスト ファイル (.txt) があります。各ツイートは改行で区切られています。ファイルを WEKA にロードしたいのですが、入力として .arff しかサポートしていません。いくつかのクラスタリング方法を使用してつぶやきをクラスタ化するつもりなので、テキスト ファイルを arff に変換するにはどうすればよいですか。
これがデータのスクリーンショットです。
cluster-analysis - Weka で高次元ベクトル用の ARFF ファイルを作成するには?
Weka を使用してクラスター化したい高次元 (200 次元) のベクトルがあります。ARFF形式でどのように表現すればよいですか?
データは次のようなものです (dim1、dim2 などは実数です):
vector_label dim1 dim2 dim3 ...... dim200
ここのリンク - http://weka.wikispaces.com/ARFF+%28stable+version%29は、次のように表現する必要があることを示しています。
等々。
これは正しいです?私が尋ねている理由は、リンクが実際には高次元ベクトルについて明確に何も言っていないからですが、私が知らないより良い表現方法があるかもしれないと感じています.
machine-learning - Arff から SVM ライト
SVMLight 形式に変換したい weka arff を作成しました。これは、arff をMLCompにロードできるようにするためです。どうすればarffを変換できますか?