3

次のリンクから、いくつかのアイデアが思いつきました。自分のやり方が正しいのか、それとも間違っているのかを問いたい。私が間違っている場合は、私を導いてください。

リンクテキスト分類に libsvm を使用
c# テキスト分類
に libsvm を使用するには?

私のやり方

最初に各トレーニング セットの単語数を計算し
ます 各単語のマッピング リストを作成します

例えば

sample word count form training set
|-----|-----------|
|     |   counts  |
|-----|-----|-----|
|text | +ve | -ve |
|-----|-----|-----|
|this | 3   | 3   |
|forum| 1   | 0   |
|is   | 10  | 12  |
|good | 10  | 5   |
|-----|-----|-----|

正のトレーニング データ

this forum is good

トレーニングセットもそうなる

+1 1:3 2:1 3:10 4:10

これはすべて、上記のリンクから受け取ったものです。
私を助けてください。

4

2 に答える 2

4

あなたはそれを正しくやっています。

あなたの laben が "+1" と呼ばれる理由はわかりません - 単純な整数でなければなりません (ドキュメント "+ve" を参照)。

ドキュメントの分類については、多くの機能を処理するために特別に設計された liblinear を参照することをお勧めします。

于 2012-05-26T18:33:00.340 に答える
0

ここから libshorttext を使用することもできます: libshortText

パイソンで

于 2014-01-28T13:45:10.273 に答える