0

ラベルが 0 ~ 100 の評価で、1 ずつ増加する分類の問題があります (例: 1、2、3、4)。

各行に名前、テキスト コーパス、および評価 (0 ~ 100) があるデータ セットがあります。

テキストコーパスから、分類器にフィードできる機能を抽出しようとしています。分類器は、行ごとに対応する評価 (0 - 100) を出力します。

機能の選択については、基本的な単語集から始めようと考えています。ただし、私の質問は分類アルゴリズムにあります。この種の問題をサポートする sci-kit Learn の分類アルゴリズムはありますか?

http://scikit-learn.org/stable/modules/multiclass.htmlを読んでいましたが、説明されているアルゴリズムは完全に離散的なラベルをサポートしているようですが、連続したラベルのセットがあります。

編集: 評価をビンに入れる場合はどうなりますか? たとえば、それぞれ 1 ~ 10 の 10 個のラベルを持つことができます。

4

2 に答える 2