http://developer.yahoo.com/search/content/V1/termExtraction.htmlと同じ結果を得る方法
この質問は、以前にかなりの回数尋ねられました。
既存のソリューションでこの問題にアプローチしようとすると、「テキスト分析」Solr は、http: //wiki.apache.org/solr/AnalyzersTokenizersTokenFilters で説明されているように、インデックスを作成する前にドキュメントに対して実行します。これには、ステミングも含まれます。
そのため、最終的な索引は、ドキュメントを説明するために使用される用語の大部分で構成されます。
直接使用するためのアナライザー、トークナイザー、およびトークン フィルターを提供するソリューションはありますか? solrが解決策である場合、solrのインデックスからこのデータを取得する最良の方法は何ですか?