テキスト (文や段落) のセマンティック分析を行って、テキストを一般的なトピックごとに分類するためのコード、製品、またはサービスを探しています。
- ファイナンス
- エンターテイメント
- テクノロジー
- 仕事
- 美術
- 等...
テキスト (文や段落) のセマンティック分析を行って、テキストを一般的なトピックごとに分類するためのコード、製品、またはサービスを探しています。
すでに分類されている例がたくさんある場合は、これらを使用して分類器をトレーニングできます。これは非常に単純なドキュメント分類の問題であり、機械学習ツールのスイートには、このためのアルゴリズムとチュートリアルがあります。たとえば、weka をチェックしてください: http://www.cs.waikato.ac.nz/ml/weka/
またはラピッドマイナー: http://rapid-i.com/content/blogcategory/38/69/
ニーズが限られており、単純な API だけが必要な場合は、次の Naive Bayes ライブラリを使用すると問題ありません: https://ci-bayes.dev.java.net/
幸運を!
これはあなたの役に立ちますか?
http://en.wikipedia.org/wiki/Document_classification
これは完成品やサービスではなく、コードでもありませんが、セマンティック分析に使用できるさまざまなアルゴリズムについて説明しています。もう少しグーグルで調べてみると、まだ実験室の外ではないと思います。人々は主に KNN アルゴリズムを試しており、結果としてクールなものが得られていますが、実際には必要なものではありません。
http://www.ebi.ac.uk/webservices/whatizit/info.jsf
しかし、あなたが求めていることを実行するソフトウェアがある場合、それは次のリストにあるでしょう:
http://www.kdnuggets.com/software/text.html
例えばLPUプログラムは、教材を十分に与えれば学習できるようです。