問題タブ [weka]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - Wekaコードを再利用してARFFファイルを解析する
誰かがこれをしましたか?このパーサーモジュールの使用方法に関するドキュメントはありますか?コードを調べましたが、解析後にデータを実際に使用する方法がわかりません。
ファイルsrc\main \ java \ weka \ core \ converters \ ArffLoader.java(Arff解析が行われる場所であると私は想定しています)には、次の手順があります。
- バッチ使用の一般的なコード:
- BufferedReaderリーダー=newBufferedReader(new FileReader( "/ some / where / file.arff"));
- ArffReader arff = new ArffReader(reader);
- インスタンスデータ=arff.getData();
- data.setClassIndex(data.numAttributes()-1);
しかし、「データ」で他に何ができるでしょうか?各行と各行の値にアクセスするにはどうすればよいですか?
(ちなみに、私はJavaを初めて使用します。このコードを実行すると、データが何を提供するかを確認するために、データに対して何らかの内省を行うことができますか?それがPythonで行うことです。)
(プロジェクトで使用する、より単純なオープンソースのArffパーサーが存在する場合はその提案も受け付けています。)
java - 奇妙なwekaインスタンスの結果
J48ツリーを使用しているときに奇妙な結果が出ます。48個の特徴のベクトルを分類する必要があります。これは非常にうまく機能しますが、「最適化」しようとすると、奇妙な結果に遭遇します。
私はメソッド分類を持っています:
それは非常にうまく機能します、そして私は私が物事を正しくやっていることを願っています。しかし、すべてのメソッド呼び出しで行われるインスタンスの作成を削除したかったので、インスタンスをBeClassified = new Instance(48);に移動しました。クラス本体に線を引きます-したがって、一度だけ作成されます。それは、他の結果と比べてわずかに異なる結果が得られるという事実にもかかわらず、うまく機能します。たとえば、400の分類から、1つが異なります(言うまでもなく、正しくありません)。しかし、その理由はわかりません...ここにwekaを使用している人がいることを願っています。そうすれば、何が起こっているのか、何が間違っているのかを理解できます。(はい、2 + featureVec.lengthは48です)。
ありがとう、よろしく。
java - NetBeans - 外部ライブラリからクラスをインポートする方法
Netbeans に Java プロジェクトがあり、プロジェクト内でWekaのいくつかのクラスを使用したいと考えています。
ここの指示に従って、ファイル C:\Program Files\Weka-3-7\weka-src.jar をライブラリに追加しました(プロジェクト、プロパティ、ライブラリ ..)
では、必要なクラスをインポートするにはどうすればよいでしょうか。
私はこのようにインポートしようとしました:
そしてキックのために、私もこれを試しましたが、どちらもうまくいきませんでした:
NetBeans は、両方に対して「パッケージが存在しません」と言います。
ライブラリを間違ってリンクしましたか? インポートを別の表現にする必要がありますか?
あなたが提供できるこれについての洞察に感謝します。
アップデート:
[プロジェクト] タブの [ライブラリ] フォルダーに次のように表示されます。
weka-src.jar とその下には、 、META-INF、lib、src.main.java.weka.associations、および weka の他の多くのものがあります。
java - ポーターステマーとウェカ
SnowBallパッケージで提供されているポーターStemmerでWekaを使用しています。Eclipse内でアプリケーションを実行すると、すべて正常に動作しますが、実行可能なjarとしてエクスポートするとすぐに(すべてのライブラリが含まれます)、wekaは次のように述べています。
どうすれば修正できますか?
java - Weka KernelEstimator クラスで帯域幅はどのように計算されますか?
Weka を使用して、特定のデータセットの確率を計算しています。具体的には、KernelEstimatorクラスを使用しています。
良好な密度推定結果を得るには、帯域幅パラメーターの選択が重要ですが、帯域幅パラメーターの計算方法を見つけることができませんでした。使用されているカーネル関数は単純なGaussian Kernelです。帯域幅パラメーターの計算方法を知っている人はいますか?
java - Weka Javaコードの使用-CSV(ヘッダー行なし)をARFF形式に変換するにはどうすればよいですか?
Weka Javaライブラリを使用してCSVファイルを読み込み、ARFFファイルに変換しています。
問題は、CSVファイルにヘッダー行がなく、データのみがあることです。CSVファイルを取り込んだ後、属性名を割り当てるにはどうすればよいですか?(すべての列は文字列データ型になります)
これが私がこれまでに持っているコードです:
私はこれを理解するためにWekaのソースコードを調べてみましたが、それの頭や尾を作ることができませんでした:-(
classification - MOA での weka 分類子の使用
weka で独自の分類器を作成しましたが、weka gui で正常に動作します。weka分類子を選択してから私の分類子を選択して、 MOAで使用しようとしています。私の分類子は、weka 分類子の下の MOA GUI に表示されますが、それを選択すると、「オプションの問題: baseLearner」エラーが発生します。MOA で新しい weka 分類器を使用することはできませんか? MOA に追加する必要がある分類器へのパスまたは参照はありますか?
前もって感謝します
machine-learning - 単純ベイズの結果の解釈
分類にNaiveBayes/Simple classifier (Weka)を使い始めましたが、データのトレーニング中に理解しなければならない問題がいくつかあります。私が使用しているデータ セットは weather.nominal.arff です。
オプションからトレーニング テストを使用すると、分類器の結果は次のようになります。
私の最初の質問は、誤って分類されたインスタンスから何を理解する必要がありますか? なぜこのような問題が発生したのでしょうか。どの属性コレクションが正しく分類されていませんか? これを理解する方法はありますか?
第 2 に、10 倍の交差検証を試みると、正しく分類されていない (少ない) インスタンスが得られるのはなぜですか?
結果は次のとおりです。
machine-learning - データのサブセットに対する分類子のパフォーマンス
Weka を使用して一連のラベル付き Web ページで分類を実行し、AUC で分類器のパフォーマンスを測定しています。分類に使用されていない別の 6 レベルの因子があり、因子の各レベルでの分類子のパフォーマンスを知りたいです。
データのサブセットで分類子のパフォーマンスをテストするには、どのような手法または手段を使用する必要がありますか?
data-mining - Weka でのサンプルの調査に関する初心者の質問
Weka を使用して、「Classify」タグの下で SVM 分類子をトレーニングしました。ここで、どのデータ サンプルが誤分類されているかをさらに調査したいと思います。そのパターンを調べる必要がありますが、Weka からこれをどこで調べればよいかわかりません。誰か助けてくれませんか?前もって感謝します。