問題タブ [standardanalyzer]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

17 問題

0 投票する

0 に答える

79 参照

java - Lucene 4 - インデックス内の数値用語を破棄するには?

Apache Luceneでインデックスを作成する前に、 Apache Tikaを使用してxml ドキュメントを解析しています。

これはティカの部分です：

StandardAnalyzer とストップワードリストを使用して、ドキュメントをトークン化します。

数値用語は必要ないので破棄できますか?

ご協力いただきありがとうございます。

2015-02-10T12:09:22.460

0 投票する

3 に答える

660 参照

java - デューク - org.apache.lucene.analysis.standard.StandardAnalyzer

https://github.com/larsga/Duke - データ重複除去のために Duke を使用しています。

Duke をセットアップしました (jar ファイル - Duke jar と lucene jar がクラスパスに追加されます) ..

github のサンプル例 - https://github.com/larsga/Duke/wiki/SemanticDogfood

一方、同じ github の他の例は機能します - https://github.com/larsga/Duke/wiki/LinkingCountries

誰でも助けてくれますか..よろしくお願いします..

java jar lucene standardanalyzer duke

2016-03-22T17:42:53.177

1 2 3 4 5 6 7 8 9 10

問題タブ [standardanalyzer]

java - Lucene 4 - インデックス内の数値用語を破棄するには?

java - デューク - org.apache.lucene.analysis.standard.StandardAnalyzer

Reference