問題タブ [multilabel-classification]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python-2.7 - sklearn を使用したマルチラベル機能選択
sklearn を使用して、マルチラベル データセットで特徴選択を実行しようとしています。ラベル全体の機能の最終セットを取得したいと考えています。これを別の機械学習パッケージで使用します。ここで見た方法を使用することを計画していました。これは、各ラベルに関連する機能を個別に選択します。
次に、これを使用して、含まれる機能のインデックスをラベルごとに抽出する予定です。
さて、私の質問は、最終モデルに含める選択した機能をどのように選択すればよいですか? すべての固有の機能 (1 つのラベルにのみ関連する機能を含む) を使用することも、より多くのラベルに関連する機能を選択するために何かを行うこともできます。
私の最初のアイデアは、特定の機能が選択されたラベルの数のヒストグラムを作成し、目視検査に基づいてしきい値を特定することです。私の懸念は、この方法が主観的であることです。sklearn を使用してマルチラベル データセットの機能選択を実行するより原則的な方法はありますか?
rapidminer - ラピッドマイナーの分類
ラベルに 12 の異なるレベルがあり、各例をこれらの 12 のいずれかに分類する必要がある単純な分類問題を解決しようとしています。ただし、出力を画像を参照するように見せたい:
http://i.stack.imgur.com/49USG.png
ここ; 信頼度のしきい値を 20% に設定したとします。出力に、20% を超えて順序付けられた各 ID のすべてのラベルを含めたい (信頼度が高い順)。どのラベルも 20% を超えていない場合。次にデフォルトのラベル。より具体的には、Rapidminer にそのような出力を提供できる既存のオペレーターはありますか?
machine-learning - OneVsRestClassifier(svm.SVC()).predict() 連続値を与える
アイリスやタイタニックなどのデータセットで y_scores=OneVsRestClassifier(svm.SVC()).predict() を使用しようとしています。問題は、y_scores を連続値として取得していることです。
knn、randomforest、naive bayes などの他の分類子モデルに OneVsRestClassifier を使用しており、次の形式で適切な結果が得られています。
虹彩データセットなど。助けてください。
c++ - 2 つの異なる LMDB を使用したマルチラベル
私はカフェフレームワークが初めてで、カフェを使用してマルチラベルでトレーニングを実装したいと考えています。2 つの LMDB を使用して、それぞれデータとラベルを保存します。データ LMDB の次元は Nx1xHxW であり、ラベル LMDB の次元は Nx1x1x3 です。ラベルは float データです。
テキストファイルは次のとおりです。
C++ を使用して LMDB を作成します。私のmain.cpp:
2 つの LMDB を正常に作成できます。しかし、caffe を使用して 2 つの LMDB でトレーニングを実装すると、結果は常に間違っています。損失レイヤーは EUCLIDEAN_LOSS であり、損失は下降できません。2つのLMDBを作成できるコードが間違っているかどうかはわかりません。誰が私を助けることができます ?ありがとうございます。
r - R のチェーン分類子
マルチラベル分類問題でチェーン分類を実行する方法はありますか。学習者を使用して同じことを達成する mlr パッケージを使用して、バイナリ関連性モデルを作成しました。ただし、バイナリ関連性のすべての分類モデルは互いに独立しており、変数の相互依存性を考慮していません。モデルを改善するために、バイナリ関連法と一緒にチェーン分類を実行できれば、非常に役立ちます。
python - GridSearchCV および OneVsRestClassifier を使用したマルチラベル分類にカスタム分類子を使用する
OneVsRestClassifier を使用して、一連のコメントに対してマルチラベル分類を実行しようとしています。私の目的は、各コメントを可能なトピックのリストにタグ付けすることです。私のカスタム分類子は、手作業で精選された単語とそれに対応する csv 内のタグのリストを使用して、各コメントにタグを付けます。Bag of Words 手法から得られた結果と、VotingClassifier を使用してカスタム分類子を組み合わせようとしています。これが私の既存のコードの一部です:
私の意図は、いくつかのヒューリスティックによって得られたこの手動でキュレーションされた単語のリストを使用して、bag of words のみを適用して得られた結果を改善することです。現在、OneVsRestClassifier を使用してラベルごとに CustomClassifier のコピーが作成されるため、予測中にどのラベルが分類されているかを知る方法を見つけるのに苦労しています。
python - 条件付きランダム フィールドを使用したマルチラベル分類
MultiLabel Classification に Conditional Random Field を使用することは可能ですか? https://pystruct.github.io/user_guide.htmlでpython CRF 実装を見ましたが、マルチラベル分類を行う方法を理解できませんでした。
data-structures - 各 Web サイトが複数のクラス ラベルを持つことができる Web 分類用の Web サイト URL を効率的に保存するにはどうすればよいですか?
各 Web サイトに複数のクラス ラベルを設定できる多数の Web サイトを保存したいと考えています。理想的には、Web サイトごとに一連のプライマリ ラベル (エンターテイメント、ニュース、スポーツなど) を用意し、これらのプライマリ ラベルのそれぞれにいくつかのサブクラス (スポーツ -> ニュースとメディア ->) を設定できます。 ...)。クラスまたはWebサイト(またはドメイン)のいずれかでデータにすばやくアクセスできるようにしたい。これを達成するための最良のデータ構造は何ですか?
neural-network - caffe の浮動小数点数で hfd5 を作成する
ラベルのカフェ ベクトルをフィードしたい (マルチ ラベル回帰問題) ため、次のリンクを使用して hdf5 ファイルを作成しました。
このコードを使用してimage_list.txt
、各行にファイルのパスとフロート ラベルを含むを作成しました。
しかし、整数ラベルでしか機能しないようです。
次のエラーを実行するdemo.m
と、次のエラーが発生します。
Error using
dataread
Trouble reading integer from file (row 1, field 3) ==> .9997 0.0236 -0.0082 -0.0231 0.9980 0.0588 0.