問題タブ [multilabel-classification]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
machine-learning - 特徴 (入力カーディナリティ) よりも多くのラベル (出力カーディナリティ) を持つデータセットが必要です
分類または回帰の問題の場合、
'X' はサイズ m X n の入力行列で、'Y' はサイズ m X k の期待される出力/ラベル行列です。
次に、k >= n のデータセットが必要です。(可能であれば、「Y」も高密度ラベルにする必要があります)
それは、ラベル/出力の数が入力特徴空間を超える場所です。そのようなデータセットの 1 つを提案してもらえますか。
よろしく、
python - scikit Learnによるテキストのマルチラベル分類
scikit-learn to texts を使用してマルチラベル分類器を作成しようとしています。私は scikit Learn が初めてで、テキストの分類子を作成できるかどうかわかりません。私の意図はSVMマルチラベルを使用することですが、テキストを適応させて分類器をトレーニングする必要があるかどうか、またはテキストを直接操作できるかどうかはわかりません。この件に関するドキュメントを知っている人はいますか?
r - R のランダム フォレスト (マルチラベル分類)
私は R にかなり慣れていないので、ランダム フォレスト アルゴリズムを実装しようとしています。
私のトレーニングとテスト セットには、次の形式の 60 個の機能があります。
トレーニング: feature1,feature2 .. feature60,Label
テスト: FileName,feature1,feature2 ... feature60
トレーニングサンプル
テストサンプル
だから私がこれまでにRで持っているのはこれです、
だから私はちょっと立ち往生しています。私は最終的に次のようなものを使用したい、
次の形式で出力を取得するには:
ファイル名、ラベル 1、ラベル 2、ラベル 3 .. ラベル 9
名前1, 0.98, 0, 0.02, 0, 0 .. 0
(基本的に、各ラベルの確率を持つファイル名)
どんな助けでも大歓迎です。ありがとうございました。
cluster-analysis - Accord.Net K-Means 分類で一貫性のない結果が得られます
Accord.Net K-Means で一貫した結果が得られないテスト プログラムがあります。
Visual Studio 2013 で実行できる再現可能なテスト プログラムを同封しています。
このプログラムはコンソール アプリケーションであり、参照する必要がある結果を再現するには:
Accord.Net 2.15 ライブラリから。
プログラムを数回実行すると、毎回異なる結果が得られます。このプログラムは、従来の Fisher Iris データセットを使用します。データセットには 150 行あり、データを 120 行のトレーニング データと 30 行のテスト データに分割します。
プログラムを実行すると、30 のうち 26 が正しく分類される可能性があります。もう一度実行すると、30 問中 2 問正解できます。
例えば:
Accord.Net を正しく使用しているかどうか疑問に思っています。どんな助けでも大歓迎です。
私のプログラムは次のとおりです。
machine-learning - 4 クラス分類の統計的尺度はどれですか?
機械学習分類子 (SVM など) で解決する 4 つのクラスの分類タスクがあります。
4 つのクラスに使用できる統計的尺度はどれですか? 私は確かにp値(順列検定付き)を使用しますが、もう少し必要です。
いくつかの興味深い尺度は、真の陽性率、真の陰性率、陽性的中率、陰性的中率、ROC 曲線の下、PR 曲線の下です....しかし、これはすべて 2 つのクラスのみであると思います。
java - マルチクラス分類のための Java-ML 結果の解釈
分類精度についての私の理解は、常に「#正しく分類されたインスタンスを #インスタンスで割ったもの」でした。Java-ML を使用し、LibSVM をマルチラベル問題に適用すると、すべてのクラスの精度 (およびその他の測定値) が得られます。それらがどのように関連しているか、全体的な精度がどの程度かはわかりません。
たとえば、私の 3 クラスの問題では、次の結果が得られます。
私のコードは次のようになります。