以下の要件に基づいてドキュメントを分類する分類子を教えてください。
分類する文書のセットがあります。分類ラベルごとに、そのクラス ラベルに固有の一連の用語があります。
以下の要件に基づいてドキュメントを分類する分類子を教えてください。
分類する文書のセットがあります。分類ラベルごとに、そのクラス ラベルに固有の一連の用語があります。
クラスの用語が既にある場合は、SVM、Naive Bayes Classifier、さらにはNeural Networkなど、いくつかの異なる種類の分類器を使用できます。
wekaやmahoutなど、この分類子を含むライブラリがいくつかあります。
最近、Naive Bayes Classifier でこれを行う方法の例を書きました: Naive Bayes Exampleですが、これは概念の説明であり、実際に使用できるツールではありません。
ドキュメントにラベルが付けられているため、これは教師あり学習に分類されます。以下の分類子のいずれかを使用して、ドキュメントを分類できます。1. 単純ベイズ分類器 2. 最近傍分類器 3. 決定木 4. 部分空間法
ほとんどの ml ライブラリには、上記の手法の実装があります。使い慣れたプログラミング言語に基づいてどの ml ライブラリを選択するかについては、このリンクを参照してください。 http://daoudclarke.github.io/machine%20learning%20in%20practice/2013/10/08/machine-learning-libraries/