4

テキスト (文や段落) のセマンティック分析を行って、テキストを一般的なトピックごとに分類するためのコード、製品、またはサービスを探しています。

  • ファイナンス
  • エンターテイメント
  • テクノロジー
  • 仕事
  • 美術
  • 等...
4

4 に答える 4

6

すでに分類されている例がたくさんある場合は、これらを使用して分類器をトレーニングできます。これは非常に単純なドキュメント分類の問題であり、機械学習ツールのスイートには、このためのアルゴリズムとチュートリアルがあります。たとえば、weka をチェックしてください: http://www.cs.waikato.ac.nz/ml/weka/

またはラピッドマイナー: http://rapid-i.com/content/blogcategory/38/69/

ニーズが限られており、単純な API だけが必要な場合は、次の Naive Bayes ライブラリを使用すると問題ありません: https://ci-bayes.dev.java.net/

幸運を!

于 2009-11-12T12:17:01.280 に答える
0

これはあなたの役に立ちますか?

http://en.wikipedia.org/wiki/Document_classification

これは完成品やサービスではなく、コードでもありませんが、セマンティック分析に使用できるさまざまなアルゴリズムについて説明しています。もう少しグーグルで調べてみると、まだ実験室の外ではないと思います。人々は主に KNN アルゴリズムを試しており、結果としてクールなものが得られていますが、実際には必要なものではありません。

http://www.ebi.ac.uk/webservices/whatizit/info.jsf

しかし、あなたが求めていることを実行するソフトウェアがある場合、それは次のリストにあるでしょう:

http://www.kdnuggets.com/software/text.html

例えばLPUプログラムは、教材を十分に与えれば学習できるようです。

http://www.cs.uic.edu/~liub/LPU/LPU-download.html

于 2009-11-11T20:43:49.583 に答える