問題タブ [multilabel-classification]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
3661 参照

opencv - opencvでbag of wordsのSIFT機能を使用するには?

画像の特徴を選別した後にバッグ オブ ワードを実装することに関する記事をたくさん読みましたが、次に何をすべきかまだ混乱しています。私は具体的に何をしますか?

早々のご案内、誠にありがとうございました。

これは私がこれまでに持っているコードです。

0 投票する
1 に答える
285 参照

scikit-learn - 強いラベル相関にもかかわらず、マルチラベルのパフォーマンス結果が独立した結果と同じなのはなぜですか?

これらの 2 つのラベルの間に強い相関関係があることがわかっている 2 つのラベルを持つデータセットがあります。ただし、相関を考慮しないscikit multilearnバイナリ関連性を使用すると、これらのラベル相関を考慮するLabelpowerset分類器と非常によく似た結果が得られますか? これについて何かコメントはありますか?その上、私はhttp://scikit-multilearn.github.io/を使用 していますが、それがどれほど有効かわかりません??

0 投票する
1 に答える
1112 参照

scikit-learn - scikit Learnのcoverage_errorメトリックの説明

sklearn.metrics モジュールで利用可能な scikit Learn で、coverage_error がどのように計算されるかを理解していません。ドキュメントの説明は次のとおりです。

coverage_error 関数は、すべての真のラベルが予測されるように、最終的な予測に含まれる必要があるラベルの平均数を計算します。

例:

私の理解によると、ここでは、y_true のすべてのラベルを取得するために、予測から 3 つのラベルを含める必要があります。したがって、カバレッジ エラー = 3/2、つまり 1.5 です。しかし、以下の場合に何が起こるか理解できません。

両方のケースでエラーが同じになるのはなぜですか?

0 投票する
1 に答える
2013 参照

scikit-learn - Sklearn: OneVsRestClassifier を使用することと、各分類器を個別に構築することの違い

私の知る限り、マルチラベルの問題は、Scikit-learn がOneVsRestClassifierなどの分類子のラッパーとして実装する 1 対すべてのスキームで解決できますsvm.SVC。文字通り訓練した場合、どのように違うのだろうかと思っています.n個のクラス、各ラベルのn個の個別のバイナリ分類子を持つマルチラベルの問題があり、それによってそれらを個別に評価するとします。

ラッパーを使用するのではなく、1対すべてを実装する「手動」の方法のようなものであることは知っていますが、実際には2つの方法は異なりますか? もしそうなら、実行時間や分類子のパフォーマンスなど、それらはどのように異なりますか?

0 投票する
1 に答える
281 参照

java - Weka フィルターがデータ損失を引き起こす

weka を使用してランダム フォレスト モデルを構築しています。私のデータは MySQL DB に保存されています。DB から直接 weka データセット (「インスタンス」オブジェクト) を作成する方法を見つけることができなかった (少なくとも単純なものではない) ため、DB にクエリを実行し、このコードを使用してデータを weka データセット (インスタンス) に操作します。 :

ほとんどのデータは「数値」として入力されますが、一部の機能 (1 番目と 2 番目) をカテゴリ (または weka 用語によると「名目」) にする必要があります。フィルターを使用してそれらを公称に変換しようとしました:

これはうまく機能しますが、驚くべきことに、データセットをデバッグすると、一部のデータが失われます!

フィルターを適用する前に:

フィルター適用後:

2 番目の属性の値が失われたのはなぜですか?

0 投票する
3 に答える
2264 参照

scikit-learn - マルチラベルを使用した sklearn-KN​​earestNeighbors

機能とそのラベルを含むデータセットがあります。

次のようになります。

このデータセットで KNeighborsClassifier をトレーニングしたいと考えています。sklearn はマルチラベルを取らないようです。私はこれを試してきました:

それは私に与えていますValueError: bad input shape

sklearn でマルチラベル分類子を実行する方法はありますか?

0 投票する
2 に答える
2439 参照

python - マルチラベル分類の nolearn

nolearn パッケージからインポートされた DBN 関数を使用しようとしましたが、これが私のコードです。

私のデータには shape(1231, 229) と shape(1231,13) のラベルがあるので、ラベル セットは ([0 0 1 0 1 0 1 0 0 0 1 1 0] ...,[.. ..])、コードを実行すると、次のエラー メッセージが表示されました: 入力形状が正しくありません (1231,13)。ここで2つの問題が発生したのではないかと思います:

  1. DBN はマルチラベル分類をサポートしていません
  2. 私のラベルは、DBN フィット関数で使用するのに適していません。
0 投票する
2 に答える
7155 参照

python - PyStruct - 一致する署名が見つかりません

ここからコードを使用しようとしています: https://github.com/pystruct/pystruct/blob/master/examples/multi_label.py

X_train には shape が(2591, 256)あり、 y_train には shapeがあり(2591, 175)ます。これを実行すると:

私はこれを得た:

リンクから直接コードを実行すると、(データセットで) 動作します。何が問題なのか知っている人はいますか?