“multilabel-classification”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

3275 参照

r - R でのマルチラベル分類

28 個の変数 (13 個のラベルと 15 個の特徴) を持つトレーニングデータセットがあります。15 個の特徴を持つテストデータセットと、特徴に基づいてこのテストデータセットのラベルを予測する必要があります。全 13 ラベルの KNN 分類器を個別に作成しました。

これら 13 個の個別ラベル KNN 分類器すべてを 1 つのマルチラベル分類器に結合する可能性はありますか?

単一ラベルの現在のコード:

私はインターネットを精査し、パッケージmldrはオプションのようですが、自分のニーズに合わせることができませんでした.

r machine-learning knn multilabel-classification

2016-01-17T22:41:12.867

0 投票する

2 に答える

1951 参照

python - scikit-learn 複数のターゲット

この例は、scikit-learn を使用して分類器の画像を作成するために残しました。

各画像は単一のカテゴリに属していますが、すべてが機能しますが、各画像はいくつかのカテゴリに属している可能性があります: 昼間の犬の写真、夜の猫の写真、夜の猫と犬の写真など...

しかし、私はこのエラーが発生します:

完全なコード

python machine-learning scikit-learn svm multilabel-classification

2016-02-23T20:00:36.780

0 投票する

1 に答える

522 参照

machine-learning - Azure 機械学習の偶数サンプリング

Azure ML で基本的なマルチラベル分類を実行しようとしています。次の形式の基本データがあります。

私の問題は、データの約 40% がラベル 1、約 20% がラベル 2、残りが約 10% であるため、私のデータでは特定のラベル (合計 5 つのうち) が過剰に表現されていることです。

これらからサンプリングしてモデルをトレーニングし、各ラベルが同じ量で表されるようにしたいと思います。

ラベル列のサンプリングモジュールで階層化オプションを試してみましたが、最初のデータセットと同じラベル分布のサンプリングしか得られませんでした。

モジュールでこれを行う方法はありますか？

machine-learning classification sampling multilabel-classification azure-machine-learning-studio

2016-02-25T12:53:42.827

0 投票する

1 に答える

743 参照

machine-learning - テキスト分類: マルチラベルテキスト分類とマルチクラステキスト分類

マルチラベル分類の問題に対処するアプローチについて質問があります。

文献レビューに基づいて、最も一般的に使用されるアプローチの 1 つが問題変換アプローチであることがわかりました。マルチラベルの問題をいくつかの単一ラベルの問題に変換し、分類結果は、バイナリ関連アプローチを使用して、各単一ラベル分類子の単純な和集合になります。

単一ラベルの問題は、バイナリ分類 (ラベルが 2 つある場合) またはマルチクラス分類問題 (ラベルが複数ある場合、つまりラベル >2 の場合) のいずれかに分類できるため、現在の変換アプローチはすべて、マルチラベル問題を多数のラベルに変換するようです。バイナリの問題。ただし、これはデータの不均衡の問題を引き起こす可能性があります。これは、ネガティブクラスがポジティブクラスよりもはるかに多くのドキュメントを持つ可能性があるためです。

ですから、私の質問は、いくつかのマルチクラスの問題に変換してから、直接マルチクラス分類アルゴリズムを適用して、データの不均衡の問題を回避してみませんか。この場合、1 つのテストドキュメントに対して、トレーニング済みの各単一ラベルマルチクラス分類器がラベルを割り当てるかどうかを予測し、そのような単一ラベルマルチクラス分類器の予測結果すべての和集合が、そのテストドキュメントのラベルの最終セットになります。

要約すると、マルチラベル分類問題を多数のバイナリ分類問題に変換するのと比較して、マルチラベル分類問題を多数のマルチクラス分類問題に変換すると、データの不均衡の問題を回避できます。これ以外は、上記の 2 つの方法ですべて同じままです: |L|(|L| は分類問題における異なるラベルの総数を意味します) 単一ラベル (バイナリまたはマルチクラス) 分類器を構築する必要があります。準備 |L| トレーニングデータとテストデータのセットの場合、テストドキュメントで各単一ラベル分類器をテストする必要があり、各単一ラベル分類器の予測結果の和集合が、テストドキュメントの最終的なラベルセットになります。

誰かが私の混乱を明確にするのを手伝ってくれることを願っています、どうもありがとう!

machine-learning text-classification multilabel-classification

2016-03-02T02:31:02.727

0 投票する

1 に答える

1953 参照

scala - Spark の勾配ブースティングツリーを使用したマルチクラス分類: バイナリ分類のみをサポート

Spark mllib で勾配ブースティングツリーを使用してマルチクラス分類を実行しようとしているとき。しかし、「バイナリ分類のみがサポートされています」というエラーが発生しています。従属変数には 8 つのレベルがあります。データには 276 の列と 7000 のインスタンスがあります。

モデル実行後のエラー:

これを行うことができる他の方法はありますか？

scala apache-spark gradient apache-spark-mllib multilabel-classification

2016-03-07T08:10:48.477

0 投票する

0 に答える

583 参照

text - マルチラベルテキスト分類用の ARFF データセットの作成方法

こんにちは、

さて、マルチラベルテキスト分類を実行したいので、このタスクを実行するために MEKA (Weka の拡張) を選択します。ただし、ドキュメントを単語のベクトルに変換する必要があります。GUI の Weka を使用しますが、ご存じのように、2 値分類のみを実行します。そのため、このタスクを実行するために MEKA を使用する傾向があります。問題は、arff を作成する方法です。ここに複数のラベルを持つファイルは例です: これはテキストです

テトラデカナールの存在下、2A°C でビブリオハーベイルシフェラーゼに FMNH(2) を添加すると、生物発光のスペクトル分布と区別できないスペクトル分布を持つ高度に蛍光性の一時的な種が形成されます。生物発光は 1.5 秒で最大強度に達し、10(-1) s(-1)、7 x 10(-3)S(-1) の指数成分で複雑に減衰します。および 7 x10(4)s(-1)。

ラベルは次のとおりです。

「FM」、「Fl」、「Ki」、「Luc」、「Lum」、「Time Factors」

私が取得したい結果：

@attribute L-class {リュック、ラム、リム、...}

@attribute F クラス {FM, Fl, Foot,...}

@attribute o-class{Ki, TimeFactors, Adult, Aged, ...}

@attribute All_words 頻度

@データ

FM,Fl,Ki,Luc,Lum,TimeFactors,2,4,6,8,8,7,4,0,1,2,2....

頭字語はラベルで、数字はテキストに出現する各用語の頻度です。誰かが私を助けることができました、私は本当に感謝しています.

text weka arff multilabel-classification

2016-03-21T19:48:21.120

0 投票する

0 に答える

687 参照

python - マルチレベルロジスティック回帰

分類タスクにロジスティック回帰を使用したいと思います。ニュース製品の説明とそのタイトルのデータセットがあります。製品カテゴリとサブカテゴリの階層ツリーもあります。階層ツリーの深さは 6 です。もちろん、各製品には、子ノードからずっと上の複数のラベルがあります。

単一レベルでロジスティック回帰を使用する方法は知っていますが、レベル 1 からレベル 2 の分類子をリーフノードに到達するまで使用する方法がわかりません。

Python の方が好きですが、Matlab と Java も使用できます。

python scikit-learn logistic-regression text-classification multilabel-classification

2016-03-24T16:42:15.170

問題タブ [multilabel-classification]

Reference