私が Lucene に保存しているドキュメントの一部には、ファイル パスまたは URI を含むフィールドがあります。クエリ用語にパスまたは URI セグメントが含まれている場合に、ユーザーがこれらのドキュメントを取得できるようにしたいと考えています。
たとえば、パスが
C:\home\user\research\whitepapers\analysis\detail.txt
ユーザーがクエリを実行してそれを見つけられるようにしたいと思いますpath:whitepapers
。
同様に、URI が
http://www.stackoverflow.com/questions/ask
を含むクエリuri:questions
はそれを取得します。
これらのフィールドには特別なアナライザーを使用する必要がありますか? それとも、StandardAnaylzer がその仕事をしてくれますか? これらのフィールドの前処理を行う必要がありますか? (たとえば、スラッシュまたはバックスラッシュをスペースに置き換えるには?)
提案を歓迎します!