1

Apache Solr でデータのインデックスを作成する際に NLP を使用したいと考えています。

  1. 単語の同義語を識別し、それもインデックスにします。

  2. 名前付きエンティティを識別し、インデックス作成中にラベルを付けます。

  3. ある人が Solr インデックスにクエリを実行すると、クエリから名前付きエンティティと意図を抽出し、クエリ文字列を形成して、インデックス付きファイルを効果的に検索できるようにする必要があります。

私の要件を満たすために利用できるツール/プラグインはありますか? これは、ほとんどのコンテンツ ベースの Web サイトで一般的な使用例だと思います。人々はそれをどのように扱っていますか?

4

2 に答える 2

4

これは、Stanford NER を SOLR で使用するためのチュートリアルです。

于 2013-08-13T23:40:33.957 に答える
2

Apache UIMAを調べる

具体的には、Solr で名前付きエンティティの認識が必要な場合は、SolrUIMAを使用してそれを UIMA と統合できます。

UIMA + Solr のデモを行っているこの講演をご覧ください。

于 2013-08-06T05:34:04.200 に答える