5

各本がカテゴリに属する​​本のリストがあります。

  • 飛行機の飛行-航空
  • 絵を描く-アート
  • 1001レシピ-料理

十分な数のサンプルデータセットがあります。いくつかのアルゴリズムを使用して、新しい本を分類する必要があります。100%正確になることは決してないでしょうが、私にとっては良い推測です。

このようなことを行うために実装するには何を使用する必要がありますか?Classifier4Jを使用する必要があり、それはVector Classifierですか?

Wekaのように見るべき他のツールはありますか?誰かが私を始めるためにいくつかの記事/例を私に指摘することができれば素晴らしいでしょう。

ありがとう

4

2 に答える 2

1

Lingpipe は良い解決策のようで、うまく機能しているようです。Lingpipe に含まれているデモは、開始するのに適した場所です。

http://alias-i.com/lingpipe/demos/tutorial/classify/read-me.html

于 2012-06-13T12:17:16.493 に答える
1

https://www.coursera.org/course/mlに Machine Learningというコースがあります。問題を分類として見る場合は、クラスの数 (=カテゴリ)Nである One-vs-All 分類器をトレーニングする必要があります。N自然言語処理クラスhttps://www.coursera.org/course/nlpで説明されているアルゴリズムを使用して分類器をトレーニングするには、通常、既存のクラスhttp://nlp.stanford.edu/IR-book/と類似性があります。 html/htmledition/text-classification-and-naive-bayes-1.html . これはすべて、 https: //cwiki.apache.org/confluence/display/MAHOUT/Bayesian を使用して Apache Mahout で実行できます。

于 2012-06-08T12:47:26.507 に答える