私のJackrabbit 2.4によると、SearchIndex要素のtextFilterClassesパラメータは廃止され、無視されます。textFilterClassesパラメータをまとめて削除すると、Pdf、Rtf などすべてがインデックス化されます。
エクストラクタを指定していない場合、どのバイナリ ファイルにインデックスを付ける必要があるかをどのように知ることができますか?
API は非推奨であると言っていますが、代替手段は提供していません。
ありがとうございました!
私のJackrabbit 2.4によると、SearchIndex要素のtextFilterClassesパラメータは廃止され、無視されます。textFilterClassesパラメータをまとめて削除すると、Pdf、Rtf などすべてがインデックス化されます。
エクストラクタを指定していない場合、どのバイナリ ファイルにインデックスを付ける必要があるかをどのように知ることができますか?
API は非推奨であると言っていますが、代替手段は提供していません。
ありがとうございました!
Jackrabbit 2.x では、デフォルトのバイナリ パーサーとして Apache Tika が導入されました。デフォルトでは、Jackrabbit にはデフォルトの tika-config.xml ファイルが付属しており、これには、解析および抽出する MIME タイプの構成が含まれています。
Jackrabbit 2.4 では、repository.xml 内から tika-config.xml の場所を設定できるはずです。
検索インデックス構成内の正しいパラメーターは、次のようになります。
<SearchIndex class="org.apache.jackrabbit.core.query.lucene.SearchIndex">
<param name="path" value="${wsp.home}/index"/>
<param name="supportHighlighting" value="true"/>
<param name="tikaConfigPath" value="${wsp.home}/tika-config.xml"/>
</SearchIndex>