問題タブ [multilabel-classification]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R でのマルチラベル分類
28 個の変数 (13 個のラベルと 15 個の特徴) を持つトレーニング データ セットがあります。15 個の特徴を持つテスト データ セットと、特徴に基づいてこのテスト データ セットのラベルを予測する必要があります。全 13 ラベルの KNN 分類器を個別に作成しました。
これら 13 個の個別ラベル KNN 分類器すべてを 1 つのマルチラベル分類器に結合する可能性はありますか?
単一ラベルの現在のコード:
私はインターネットを精査し、パッケージmldr
はオプションのようですが、自分のニーズに合わせることができませんでした.
python - scikit-learn 複数のターゲット
この例は、scikit-learn を使用して分類器の画像を作成するために残しました。
各画像は単一のカテゴリに属していますが、すべてが機能しますが、各画像はいくつかのカテゴリに属している可能性があります: 昼間の犬の写真、夜の猫の写真、夜の猫と犬の写真など...
しかし、私はこのエラーが発生します:
完全なコード
machine-learning - Azure 機械学習の偶数サンプリング
Azure ML で基本的なマルチラベル分類を実行しようとしています。次の形式の基本データがあります。
私の問題は、データの約 40% がラベル 1、約 20% がラベル 2、残りが約 10% であるため、私のデータでは特定のラベル (合計 5 つのうち) が過剰に表現されていることです。
これらからサンプリングしてモデルをトレーニングし、各ラベルが同じ量で表されるようにしたいと思います。
ラベル列のサンプリング モジュールで階層化オプションを試してみましたが、最初のデータセットと同じラベル分布のサンプリングしか得られませんでした。
モジュールでこれを行う方法はありますか?
machine-learning - テキスト分類: マルチラベル テキスト分類とマルチクラス テキスト分類
マルチラベル分類の問題に対処するアプローチについて質問があります。
文献レビューに基づいて、最も一般的に使用されるアプローチの 1 つが問題変換アプローチであることがわかりました。マルチラベルの問題をいくつかの単一ラベルの問題に変換し、分類結果は、バイナリ関連アプローチを使用して、各単一ラベル分類子の単純な和集合になります。
単一ラベルの問題は、バイナリ分類 (ラベルが 2 つある場合) またはマルチクラス分類問題 (ラベルが複数ある場合、つまりラベル >2 の場合) のいずれかに分類できるため、現在の変換アプローチはすべて、マルチラベル問題を多数のラベルに変換するようです。バイナリの問題。ただし、これはデータの不均衡の問題を引き起こす可能性があります。これは、ネガティブ クラスがポジティブ クラスよりもはるかに多くのドキュメントを持つ可能性があるためです。
ですから、私の質問は、いくつかのマルチクラスの問題に変換してから、直接マルチクラス分類アルゴリズムを適用して、データの不均衡の問題を回避してみませんか。この場合、1 つのテスト ドキュメントに対して、トレーニング済みの各単一ラベル マルチクラス分類器がラベルを割り当てるかどうかを予測し、そのような単一ラベル マルチクラス分類器の予測結果すべての和集合が、そのテスト ドキュメントのラベルの最終セットになります。
要約すると、マルチラベル分類問題を多数のバイナリ分類問題に変換するのと比較して、マルチラベル分類問題を多数のマルチクラス分類問題に変換すると、データの不均衡の問題を回避できます。これ以外は、上記の 2 つの方法ですべて同じままです: |L|(|L| は分類問題における異なるラベルの総数を意味します) 単一ラベル (バイナリまたはマルチクラス) 分類器を構築する必要があります。準備 |L| トレーニング データとテスト データのセットの場合、テスト ドキュメントで各単一ラベル分類器をテストする必要があり、各単一ラベル分類器の予測結果の和集合が、テスト ドキュメントの最終的なラベル セットになります。
誰かが私の混乱を明確にするのを手伝ってくれることを願っています、どうもありがとう!
scala - Spark の勾配ブースティング ツリーを使用したマルチクラス分類: バイナリ分類のみをサポート
Spark mllib で勾配ブースティング ツリーを使用してマルチクラス分類を実行しようとしているとき。しかし、「バイナリ分類のみがサポートされています」というエラーが発生しています。従属変数には 8 つのレベルがあります。データには 276 の列と 7000 のインスタンスがあります。
モデル実行後のエラー:
これを行うことができる他の方法はありますか?
text - マルチラベル テキスト分類用の ARFF データセットの作成方法
こんにちは、
さて、マルチラベル テキスト分類を実行したいので、このタスクを実行するために MEKA (Weka の拡張) を選択します。ただし、ドキュメントを単語のベクトルに変換する必要があります。GUI の Weka を使用しますが、ご存じのように、2 値分類のみを実行します。そのため、このタスクを実行するために MEKA を使用する傾向があります。問題は、arff を作成する方法です。ここに複数のラベルを持つファイルは例です: これはテキストです
テトラデカナールの存在下、2A°C でビブリオ ハーベイルシフェラーゼに FMNH(2) を添加すると、生物発光のスペクトル分布と区別できないスペクトル分布を持つ高度に蛍光性の一時的な種が形成されます。生物発光は 1.5 秒で最大強度に達し、10(-1) s(-1)、7 x 10(-3)S(-1) の指数成分で複雑に減衰します。および 7 x10(4)s(-1)。
ラベルは次のとおりです。
「FM」、「Fl」、「Ki」、「Luc」、「Lum」、「Time Factors」
私が取得したい結果:
@attribute L-class {リュック、ラム、リム、...}
@attribute F クラス {FM, Fl, Foot,...}
@attribute o-class{Ki, TimeFactors, Adult, Aged, ...}
@attribute All_words 頻度
@データ
FM,Fl,Ki,Luc,Lum,TimeFactors,2,4,6,8,8,7,4,0,1,2,2....
頭字語はラベルで、数字はテキストに出現する各用語の頻度です。誰かが私を助けることができました、私は本当に感謝しています.
python - マルチレベルロジスティック回帰
分類タスクにロジスティック回帰を使用したいと思います。ニュース製品の説明とそのタイトルのデータ セットがあります。製品カテゴリとサブカテゴリの階層ツリーもあります。階層ツリーの深さは 6 です。もちろん、各製品には、子ノードからずっと上の複数のラベルがあります。
単一レベルでロジスティック回帰を使用する方法は知っていますが、レベル 1 からレベル 2 の分類子をリーフ ノードに到達するまで使用する方法がわかりません。
Python の方が好きですが、Matlab と Java も使用できます。