data-mining - 大量のテキストからの情報のフィルタリング

Question

テキストの本文から情報を見つけることができるベストプラクティス、アルゴリズム、またはソフトウェア（パーミッシブライセンスが必要なオープンソース...）はありますか？私が言及しているのは：

RapidMinerはこのようなテキストマイニングを実行できるはずだと聞きましたが、AGPLは私の目的には受け入れられないライセンスです。

この種の分析を行うための「標準」はありますか？

score 1 · Accepted Answer

固有表現抽出について読んでください。ApacheOpenNLPまたはApacheUIMAを試すことができます。どちらも、Apacheライセンスを持っています。

score 1 · Accepted Answer

このようなエンティティタイプの場合、 gexpなどのルールベースのNERツールを使用できます。

2 に答える 2