センチメントを予測するために libsvm を使用しています。単語数を使用していると仮定して、入力の形式を知りたいと思いました。
[label] [index]:[value] [index]:[value]
これは、libsvm から必要な形式です。つまり、ラベルが 2 つ (1 つは正のラベル、もう 1 つは負のラベル) で、インデックスはそのラベルの下の各単語になり、値は各単語の頻度になりますか?
これは、テスト セットで使用する単語からインデックスへのマッピングを保存する必要があるということですか?