“weka”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

1237 参照

python - 単語頻度から ARFF を作成する

テキストで発生する頻度を含む単語のリストを提供するコードがいくつかあります。コードが上位10単語を自動的にARFFに変換するようにしようとしています

@RELATION 単語頻度

@ATTRIBUTE 単語文字列 @ATTRIBUTE 頻度数値

上位 10 件は頻度とともにデータとして表示されます。

現在のコードでこれを行う方法に苦労しています

これを行う方法は本当に私の頭を悩ませています!

2011-03-31T13:17:31.793

0 投票する

1 に答える

1607 参照

weka - wekaのARFFからのデータの分類

wekaエクスプローラーにロードしたARFFがあります。私はwekaにまったく慣れていませんが、私の理解では、私が持っているarffは機能しているはずですが、分類子のどれもそれで機能していないように見えますか？

arffファイルに追加するのを見逃したものはありますか？どんな助けでも大歓迎です。ありがとう。

weka arff

2011-03-31T15:36:04.733

0 投票する

4 に答える

5309 参照

weka - WEKA: classifyInstance からスコアを取得するには?

FilteredClassifier.classifyInstance() を使用して、weka でインスタンスを分類しています。

私は 2 つのクラス (true と false) を持っており、多くの肯定的な結果を持っているため、最高の肯定的な結果を得るには、実際には各インスタンスのスコアを知る必要があります。

weka 分類子からスコアを取得する方法を知っていますか?

ありがとう

更新: distributionForInstance も使用しようとしましたが、インスタンスごとに常に [1.0, 0.0] の配列を取得します。

実際には、いくつかのインスタンスを比較して、どれが最も信頼性が高く、どれがより多くの変更を加えて正しく分類されているかを確認する必要があります。

weka

2011-04-06T08:15:52.370

0 投票する

1 に答える

3530 参照

file - weka ツールに適した入力ファイル形式を取得するには?

weka ツールを使用して、データセットから一連の分類ルールを生成しようとしています。データセットは現在、次の形式の .txt ファイルです。

(各単語はタブで区切られています)

これをwekaの適切な入力ファイルに変換するにはどうすればよいですか? csv に変換してから arff 形式に変換しようとしましたが、うまくいかず、2 つのエラーheader stream is invalidまたはattribute names are not unique.

file text weka

2011-04-08T04:03:08.457

0 投票する

1 に答える

478 参照

attributes - WEKA では、離散化後に範囲を切り上げることはできますか?

数値型の属性があり、それを 6 つのビンに離散化しました。
しかし、離散化後、範囲は次のようになります(3.663336-4.325577]

まとめにしたい場合、またはそのように見せたい場合は(3.7-4.3]どうすればよいですか?

ありがとう。

attributes weka

2011-04-17T05:15:45.260

0 投票する

3 に答える

7138 参照

r - R: 実行するたびにクラスタリングの結果が異なる

'amap' パッケージに入れて数回実行しますが、パラメーターとシード値は常に同じですが、Kmeans やその他のクラスターメソッドを実行するたびに、クラスター化の結果が異なります。

別のパッケージで別の kmeans 関数を試しましたが、それでも同じです...

実は、Weka と R を併用したいのでSimpleKMeans、RWeka パッケージでも試してみましたが、これは常に同じ値を返します。ただし、問題は、クラスタ化されたデータをSimpleKmeansのクラスタ番号とともにRWekaに保存する方法がわからないため、行き詰まっていることです...

とにかく、クラスタリングの結果を常に同じに保つにはどうすればよいですか? SimpleKmeansまたはクラスタリングの結果をRに保存するにはどうすればよいですか?

r cluster-analysis weka k-means

2011-04-17T20:55:23.493

0 投票する

2 に答える

2255 参照

java - JavaSimpleDateFormatは問題をWEKAに解析します

正しい日付形式を使用していることを誓いますが、WEKAにロードするときに解析エラーが発生し続けます。

データセットの例を次に示します。

WEKAエラー：

APIドキュメントを使用して再確認しました-何かが足りませんか？

http://download.oracle.com/javase/1.4.2/docs/api/java/text/SimpleDateFormat.html

編集 - - - - - -

トークンをスペースで区切るためのフォーマットされた日付。まだWEKAでボールをプレーしていません...

java date date-format weka arff

2011-04-18T14:11:12.740

0 投票する

1 に答える

590 参照

java - Weka GUIの出力がJavaコードと異なるのはなぜですか？

Weka GUIでフィルターStringToWordVectorを実行した結果が、同等のJavaコードと異なるのはなぜですか？私はGUIで使用したのと同じ属性を使用していますが、Javaのトークナイザーは適切な仕事をしていないようです！私は博士課程の学生から、それは一般的であり、彼からのそれ以上の回答はないと言われました。

助けてください。私のプロジェクトは行き詰まっています。

これが私のコードです：

java user-interface weka

2011-04-22T02:07:03.953

0 投票する

4 に答える

18469 参照

cluster-analysis - WEKA K-Means クラスタリング

WEKA での K-Means クラスタリングの出力が実際に何を意味するのか、誰か説明できますか?

例えば

列の数字は実際には何を意味するのか、表の上にあるクラスターの重心と書かれていますが、2 つのクラスターの重心が何であるかを判断するにはどうすればよいでしょうか?

誰かが数字の意味を説明できれば、私は最も感謝しています.

見つかったクラスターのシルエット評価を完了する方法について何かアイデアがあれば、それも素晴らしいでしょう。

ありがとう

cluster-analysis data-mining weka k-means

2011-04-26T14:09:33.653

0 投票する

1 に答える

1093 参照

machine-learning - WEKA：属性スケールの問題

トレーニングデータセットと複数のテストセットがあります（クラスタリングフレームワークでインスタンスを分類しているため、テストセットのインスタンスはオンザフライで計算されます）。

インスタンス属性のスケールは異なります（最初の属性は0から1まで変化し、2番目の属性は0から100まで変化します）。

私の分類器（ロジスティック回帰とSMO）は、テスト全体が一度に設定されていないという事実にどのように対処しますか？

言い換えると、テストセットの最大値がわからない場合、さまざまなスケール属性をどのように処理しますか？

ありがとう

machine-learning weka svm

2011-05-02T13:06:10.077

問題タブ [weka]

Reference