問題タブ [arff]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
weka - Weka の ARFF 形式の属性が多すぎます
10,000 を超えるディメンションのデータセットを使用しています。Wekaを使うにはテキストファイルをARFF形式に変換する必要がありますが、スパースARFF形式を使っても属性が多すぎてファイルサイズが大きすぎます。ARFFファイルのヘッダーのように多くの属性識別子を書き込まないようにするためのデータと同様の方法はありますか?
例:
@attribute A1
NUMERICAL @attribute A2 NUMERICAL
...
...
@attribute A10000 NUMERICAL
weka - 欠測値を持つWeka
この人としてのwekaについて質問があります:
こんにちは、みんな:
私はこれについてWEKAについて本当に奇妙に感じました。
欠測値が多いCSVファイルを用意しました。このファイルで欠落している値の1つは基本的なものであり、コンマのペア、つまり、random_value1,,random_value2の間に値はありません。これはフォーマットの例です。カンマのペアがあり、それらの間に空白がなくても何もないことがわかります。これは、データの値が欠落していることを示しているはずです。
奇妙なことに、このCSVをWEKAに読み込むと、WEKAは欠落しているすべての値を疑問符(つまり「?」)に割り当てます。これがまさにWEKAの表現です。
そして、テスト分析を実行すると、WEKAはこれらの「?」に取り組み始めました。ある種の有用な情報として。値が欠落しているだけですが、WEKAはそれを飛び越えてください。
これらの問題は本当に無駄になりました。分析結果は、欠落している場合は値が欠落している、欠落しているものは欠落している、欠落している相関関係が欠落している場合のように読み取られます。
WEKAは、欠落している値を、ある種の疑問符ではなく、欠落している値として読み取ることができますか?または、WEKAにすべての「?」について、それらを欠測値として扱うように指示できますか?
みんなありがとう
彼はこの解決策を使用して問題を解決しました。
私は行方不明についてWEKAに伝える方法を見つけました。ASCIIエディタのfine_and_replace関数を使用して、すべての「?」を置き換えます。に ?。
>>
しかし、ASCIIエディタをダウンロードして使用する方法がわかりませんでした。
java - Weka印刷のまばらなarffファイル
ここに示すように、arffファイルのスパース表現を試していました。私のプログラムでは、クラスラベル「B」を印刷できますが、何らかの理由で「A」を印刷していません。
プログラムの出力は次のようになります-
しかし、私がするとき
適切な出力が得られます-
何らかの理由でインデックス0を取得していません。なぜこれが発生しているのか誰かに教えてもらえますか?
r - Rでarffファイルを読む
R を使用して、UCI with Amazon レビューからデータセットを読み取りたい.
データセットの形式は ARFF (.arff) です。
次のスクリプトを使用しています。
そして、次のエラーが表示されます
read.arff("amazon.arff") のエラー: 属性の指定が無効です。
先程はお世話になりました。
weka - weka での ARFF 出力は、増分保存されたかどうかによって異なります
以下は、weka の ARFF セーバーがインクリメンタル モードで書き込みを行っている場合に文字列が正しく出力されないことを示すプログラムです。以下のプログラムは、パラメーターがプログラムに渡される場合はインクリメンタル モードで実行され、パラメーターが渡されない場合はバッチ モードで実行されます。
バッチ モードでは、ARFF ファイルに文字列が含まれていることに注意してください。通常の操作です。インクリメンタル モードでは、ARFF ファイルには文字列の代わりに整数が含まれています... 奇妙な !
ARFF フォーマッタで文字列をインクリメンタル形式で出力する方法についてのアイデアはありますか?
weka - .txtから.arffファイルを作成するにはどうすればよいですか?
それを行う簡単な方法はありますか?私はJavaを使用しておらず、Pythonを初めて使用するため、別の方法が必要になります。前もって感謝します!
weka - Weka の公称属性の値の範囲
Weka を使用した数値予測に使用する公称属性があります。しかし、このNominal Attributeにはたまたま957 の可能な値 (1-957) があります。ARFF 入力ファイルでそれを指定する方法はありますか。明らかな方法の 1 つは、1 ~ 957 個のコンマ区切りのエントリを生成するスクリプトを作成することです。
しかし、WEKAが提供する回避策があるかどうか疑問に思っていましたか?
machine-learning - WEKA-arff形式のベクトル属性
私はWekaを初めて使用し、EEGデータを分類するための分類器を構築しようとしています。EEG属性データは、記録された5分間の生信号とその他の属性です。インスタンスに5分の生信号のベクトル入力があることをWEKAarffファイル形式で指定するにはどうすればよいですか?
例えば:
raw
属性ベクトルはどこにありますか。
weka - Weka - クラス属性の公称値を定義するために複数の行を使用する
代わりに私のARFFファイルで:
次のようなものを書きたいと思います:
理由: myclass には最終的にほぼ 1000 の値が含まれるため、arff ファイルの読み取りと編集は 2 番目の形式を使用した方が簡単です。
上記の形式を使用してみましたが、「arff として構造を判別できません。
weka - wekaで「クラス階層属性」を宣言する方法
Wekaを使用して.arffファイルを作成し、CLUSで実行しようとしています。しかし、私は階層属性に問題があります。
@attribute'クラス階層'{ダミー、トップ/アート/アニメーション、トップ/アート}
このコードで.arffを作成します。
次に、CLUSで「training.arff」を実行すると、次のエラーメッセージが表示されます。
エラー:クラス値がツリー階層にありません:Top / Arts / Animation(ルックアップ:アニメーション、用語:Top / Arts、サブ用語:アニメーション})
問題は、階層属性を名目属性として宣言する方法だと思いますが、この属性を宣言する方法は他にありません。
すべての提案が役に立ちます。前もって感謝します。