問題タブ [weka]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 単語頻度から ARFF を作成する
テキストで発生する頻度を含む単語のリストを提供するコードがいくつかあります。コードが上位10単語を自動的にARFFに変換するようにしようとしています
@RELATION 単語頻度
@ATTRIBUTE 単語文字列 @ATTRIBUTE 頻度 数値
上位 10 件は頻度とともにデータとして表示されます。
現在のコードでこれを行う方法に苦労しています
これを行う方法は本当に私の頭を悩ませています!
weka - wekaのARFFからのデータの分類
wekaエクスプローラーにロードしたARFFがあります。私はwekaにまったく慣れていませんが、私の理解では、私が持っているarffは機能しているはずですが、分類子のどれもそれで機能していないように見えますか?
arffファイルに追加するのを見逃したものはありますか?どんな助けでも大歓迎です。ありがとう。
weka - WEKA: classifyInstance からスコアを取得するには?
FilteredClassifier.classifyInstance() を使用して、weka でインスタンスを分類しています。
私は 2 つのクラス (true と false) を持っており、多くの肯定的な結果を持っているため、最高の肯定的な結果を得るには、実際には各インスタンスのスコアを知る必要があります。
weka 分類子からスコアを取得する方法を知っていますか?
ありがとう
更新: distributionForInstance も使用しようとしましたが、インスタンスごとに常に [1.0, 0.0] の配列を取得します。
実際には、いくつかのインスタンスを比較して、どれが最も信頼性が高く、どれがより多くの変更を加えて正しく分類されているかを確認する必要があります。
file - weka ツールに適した入力ファイル形式を取得するには?
weka ツールを使用して、データセットから一連の分類ルールを生成しようとしています。データセットは現在、次の形式の .txt ファイルです。
(各単語はタブで区切られています)
これをwekaの適切な入力ファイルに変換するにはどうすればよいですか? csv に変換してから arff 形式に変換しようとしましたが、うまくいかず、2 つのエラーheader stream is invalid
またはattribute names are not unique
.
attributes - WEKA では、離散化後に範囲を切り上げることはできますか?
数値型の属性があり、それを 6 つのビンに離散化しました。
しかし、離散化後、範囲は次のようになります(3.663336-4.325577]
まとめにしたい場合、またはそのように見せたい場合は(3.7-4.3]
どうすればよいですか?
ありがとう。
r - R: 実行するたびにクラスタリングの結果が異なる
'amap' パッケージに入れて数回実行しますが、パラメーターとシード値は常に同じですが、Kmeans やその他のクラスター メソッドを実行するたびに、クラスター化の結果が異なります。
別のパッケージで別の kmeans 関数を試しましたが、それでも同じです...
実は、Weka と R を併用したいのでSimpleKMeans
、RWeka パッケージでも試してみましたが、これは常に同じ値を返します。ただし、問題は、クラスタ化されたデータをSimpleKmeansのクラスタ番号とともにRWekaに保存する方法がわからないため、行き詰まっていることです...
とにかく、クラスタリングの結果を常に同じに保つにはどうすればよいですか? SimpleKmeans
またはクラスタリングの結果をRに保存するにはどうすればよいですか?
java - JavaSimpleDateFormatは問題をWEKAに解析します
正しい日付形式を使用していることを誓いますが、WEKAにロードするときに解析エラーが発生し続けます。
データセットの例を次に示します。
WEKAエラー:
APIドキュメントを使用して再確認しました-何かが足りませんか?
http://download.oracle.com/javase/1.4.2/docs/api/java/text/SimpleDateFormat.html
編集 - - - - - -
トークンをスペースで区切るためのフォーマットされた日付。まだWEKAでボールをプレーしていません...
java - Weka GUIの出力がJavaコードと異なるのはなぜですか?
Weka GUIでフィルターStringToWordVectorを実行した結果が、同等のJavaコードと異なるのはなぜですか?私はGUIで使用したのと同じ属性を使用していますが、Javaのトークナイザーは適切な仕事をしていないようです!私は博士課程の学生から、それは一般的であり、彼からのそれ以上の回答はないと言われました。
助けてください。私のプロジェクトは行き詰まっています。
これが私のコードです:
cluster-analysis - WEKA K-Means クラスタリング
WEKA での K-Means クラスタリングの出力が実際に何を意味するのか、誰か説明できますか?
例えば
列の数字は実際には何を意味するのか、表の上にあるクラスターの重心と書かれていますが、2 つのクラスターの重心が何であるかを判断するにはどうすればよいでしょうか?
誰かが数字の意味を説明できれば、私は最も感謝しています.
見つかったクラスターのシルエット評価を完了する方法について何かアイデアがあれば、それも素晴らしいでしょう。
ありがとう
machine-learning - WEKA:属性スケールの問題
トレーニングデータセットと複数のテストセットがあります(クラスタリングフレームワークでインスタンスを分類しているため、テストセットのインスタンスはオンザフライで計算されます)。
インスタンス属性のスケールは異なります(最初の属性は0から1まで変化し、2番目の属性は0から100まで変化します)。
私の分類器(ロジスティック回帰とSMO)は、テスト全体が一度に設定されていないという事実にどのように対処しますか?
言い換えると、テストセットの最大値がわからない場合、さまざまなスケール属性をどのように処理しますか?
ありがとう