各ラベルが確率であるマルチラベルターゲットを持つ機械学習の問題に取り組んでいます。過去にマルチラベルの問題を扱ったことがありますが、各ラベルはバイナリでした。たとえば、ターゲットが一連の本のトピック (「Python」、「Machine Learning」、「Fairy Tales」、「Cooking」) である場合、Python の scikit Learn に基づく機械学習の本は [1, 1, 0、0]。
今、私が解決しようとしている問題について、私のターゲットはバイナリではありません。ターゲット自体は、[0.75、0.25、0、0] のような一連の確率です。ターゲットはクラウド ソーシング方式で作成されたと思います。これらの確率は、人々の判断のばらつきを反映しています。したがって、クラスの確率をバケット化する必要がない限り (つまり、p<0.5 ->0、p>=0.5 ->1)、ターゲットを 0 と 1 の間で制約する必要がある回帰問題に行き詰まります。任意のアイデアどのタイプのアルゴリズムを試すことができますか? Python の scikit Learn を使用しています。
ありがとう!