私はBooksオブジェクトのセットを持っています.Bookクラスは次のように定義されています:
Class Book{
String title;
ArrayList<tags> taglist;
}
titleは本のタイトルです。例: Javascript for dummies。
taglistは、この例のタグのリストです: Javascript、jquery、「web dev」、..
私が言ったように、IT、生物学、歴史など、さまざまなことについて話している本のセットがあります...各本には、タイトルとそれを説明するタグのセットがあります..
これらの本を、トピックごとに別のセットに自動的に分類する必要があります。例:
ITブックス:
- ダミーのための Java
- ダミー用 Javascript
- 30日でフラッシュを学ぶ
- C++ プログラミング
歴史書:
- 世界大戦
- 1960年のアメリカ
- マーティン・ルーサー・キングの生涯
生物学の本:
- ....
そのような問題に適用する分類アルゴリズム/方法を知っていますか?
解決策は、外部 API を使用してテキストのカテゴリを定義することですが、ここでの問題は、書籍の言語がフランス語、スペイン語、英語など異なることです。