1

私はAlfrescoを少し使用していましたが、ドキュメントからメタデータを抽出するために、ApacheTikaの上に薄い抽象化レイヤーがありました。

このような堅牢なソリューションは必要ないため、Jackrabbitのみを使用することにしました。しかし、jackrabbit-text-extractorsモジュールを除いて、ドキュメントメタデータ(Dublinコアプロパティ)に対する他のサポートはありません。

jackrabbit-text-extractorsmavenアーティファクトバージョン2.0以上-SNAPSHOTはSVNトランクにないようです。

誰かがどのアプローチを選ぶべきか教えてもらえますか?

4

1 に答える 1

1

私の理解では、ジャックラビットは現在、テキスト抽出に tika を使用しています

https://issues.apache.org/jira/browse/JCR-1878

于 2011-02-28T23:50:16.573 に答える