http://wiki.apache.org/solr/TermVectorComponentを使用すると、インデックスに保存されているドキュメントのインデックス付き用語とその頻度を取得できます。テキストをインデックスに保存せずに、テキストについて同じ情報を取得するにはどうすればよいですか? SOLR でテキストを処理して情報を返したいだけですが、ドキュメントをインデックスに保存する必要はありません。
質問する
2061 次
4 に答える
1
あなたが求めていることから、完全な検索エンジン (サービス) ではなく、実際には検索ライブラリが必要であると結論付けています。そのライブラリが Lucene です。おそらく、これは初心者に役立つでしょう: How to extract Document Term Vector in Lucene 3.5.0。必要なビットを計算するためにインデックスを RAM に格納してから、インデックスを削除することができます。
于 2013-08-20T19:29:55.783 に答える