私はAlfrescoを少し使用していましたが、ドキュメントからメタデータを抽出するために、ApacheTikaの上に薄い抽象化レイヤーがありました。
このような堅牢なソリューションは必要ないため、Jackrabbitのみを使用することにしました。しかし、jackrabbit-text-extractorsモジュールを除いて、ドキュメントメタデータ(Dublinコアプロパティ)に対する他のサポートはありません。
jackrabbit-text-extractorsmavenアーティファクトバージョン2.0以上-SNAPSHOTはSVNトランクにないようです。
誰かがどのアプローチを選ぶべきか教えてもらえますか?