問題タブ [multilabel-classification]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
opencv - opencvでbag of wordsのSIFT機能を使用するには?
画像の特徴を選別した後にバッグ オブ ワードを実装することに関する記事をたくさん読みましたが、次に何をすべきかまだ混乱しています。私は具体的に何をしますか?
早々のご案内、誠にありがとうございました。
これは私がこれまでに持っているコードです。
scikit-learn - 強いラベル相関にもかかわらず、マルチラベルのパフォーマンス結果が独立した結果と同じなのはなぜですか?
これらの 2 つのラベルの間に強い相関関係があることがわかっている 2 つのラベルを持つデータセットがあります。ただし、相関を考慮しないscikit multilearnバイナリ関連性を使用すると、これらのラベル相関を考慮するLabelpowerset分類器と非常によく似た結果が得られますか? これについて何かコメントはありますか?その上、私はhttp://scikit-multilearn.github.io/を使用 していますが、それがどれほど有効かわかりません??
scikit-learn - scikit Learnのcoverage_errorメトリックの説明
sklearn.metrics モジュールで利用可能な scikit Learn で、coverage_error がどのように計算されるかを理解していません。ドキュメントの説明は次のとおりです。
coverage_error 関数は、すべての真のラベルが予測されるように、最終的な予測に含まれる必要があるラベルの平均数を計算します。
例:
私の理解によると、ここでは、y_true のすべてのラベルを取得するために、予測から 3 つのラベルを含める必要があります。したがって、カバレッジ エラー = 3/2、つまり 1.5 です。しかし、以下の場合に何が起こるか理解できません。
両方のケースでエラーが同じになるのはなぜですか?
scikit-learn - Sklearn: OneVsRestClassifier を使用することと、各分類器を個別に構築することの違い
私の知る限り、マルチラベルの問題は、Scikit-learn がOneVsRestClassifier
などの分類子のラッパーとして実装する 1 対すべてのスキームで解決できますsvm.SVC
。文字通り訓練した場合、どのように違うのだろうかと思っています.n個のクラス、各ラベルのn個の個別のバイナリ分類子を持つマルチラベルの問題があり、それによってそれらを個別に評価するとします。
ラッパーを使用するのではなく、1対すべてを実装する「手動」の方法のようなものであることは知っていますが、実際には2つの方法は異なりますか? もしそうなら、実行時間や分類子のパフォーマンスなど、それらはどのように異なりますか?
java - Weka フィルターがデータ損失を引き起こす
weka を使用してランダム フォレスト モデルを構築しています。私のデータは MySQL DB に保存されています。DB から直接 weka データセット (「インスタンス」オブジェクト) を作成する方法を見つけることができなかった (少なくとも単純なものではない) ため、DB にクエリを実行し、このコードを使用してデータを weka データセット (インスタンス) に操作します。 :
ほとんどのデータは「数値」として入力されますが、一部の機能 (1 番目と 2 番目) をカテゴリ (または weka 用語によると「名目」) にする必要があります。フィルターを使用してそれらを公称に変換しようとしました:
これはうまく機能しますが、驚くべきことに、データセットをデバッグすると、一部のデータが失われます!
フィルターを適用する前に:
フィルター適用後:
2 番目の属性の値が失われたのはなぜですか?
scikit-learn - マルチラベルを使用した sklearn-KNearestNeighbors
機能とそのラベルを含むデータセットがあります。
次のようになります。
このデータセットで KNeighborsClassifier をトレーニングしたいと考えています。sklearn はマルチラベルを取らないようです。私はこれを試してきました:
それは私に与えていますValueError: bad input shape
sklearn でマルチラベル分類子を実行する方法はありますか?
python - マルチラベル分類の nolearn
nolearn パッケージからインポートされた DBN 関数を使用しようとしましたが、これが私のコードです。
私のデータには shape(1231, 229) と shape(1231,13) のラベルがあるので、ラベル セットは ([0 0 1 0 1 0 1 0 0 0 1 1 0] ...,[.. ..])、コードを実行すると、次のエラー メッセージが表示されました: 入力形状が正しくありません (1231,13)。ここで2つの問題が発生したのではないかと思います:
- DBN はマルチラベル分類をサポートしていません
- 私のラベルは、DBN フィット関数で使用するのに適していません。
python - PyStruct - 一致する署名が見つかりません
ここからコードを使用しようとしています: https://github.com/pystruct/pystruct/blob/master/examples/multi_label.py
X_train には shape が(2591, 256)
あり、 y_train には shapeがあり(2591, 175)
ます。これを実行すると:
私はこれを得た:
リンクから直接コードを実行すると、(データセットで) 動作します。何が問題なのか知っている人はいますか?