この質問を読んでいただきありがとうございます。
LuceneでRTFファイルのインデックスを作成しようとしています。それを行う方法はいくつかあるように見えますが、それらはすべて本文テキストを抽出してLuceneに渡すだけのようです。これはフィールドを破壊すると思います。ファイルパス(表示用)と本文テキスト(クエリ用)にインデックスを付けたい場合、この問題をどのように解決できますか?
ありがとう :)
必要な追加フィールド(この場合はパス)ごとに、ファイルとともに指定された値を使用してリテラルパラメーターを追加するだけです。
ドキュメントについては、こちらをご覧ください。あなたの場合は
curl "http://localhost:8983/solr/update/extract?literal.path=\path\to\tutorial&commit=true" -F "myfile=@tutorial.html"
\をエンコードする必要がある場合は、その%5C