過去 2 年間、Liferay を頻繁に使用してきましたが、大規模なドキュメント管理は必要ありませんでした。
現在、ユーザーがドキュメント (MS Office OLE2 ドキュメント、ODS ドキュメント、PDF など) をアップロードするポートレットがあり、利用可能なすべてのメタデータを保持する必要があります。
Liferay を使用せずにそれを行う方法はわかっています。おそらく、Apache Tika ( UpdateRichDocumentsおよびExtractingRequestHandler ) で Apache solr を使用するか、内部で Apache Tika を使用している Apache Jackrabbit (org.apache.jackrabbit.extractor.*) を使用します。
問題は、Liferay のトランクを見ると、いくつかの重要なクラスがあることです。
Hooks (JCRHook, FileSystemHook, CMISHook, s3Hook)
DLLocalServiceImpl
社内から直接雇用されている
もう 1 つの方法は、これを使用する DLAppLocalServiceImpl
ことでDLRepositoryLocalServiceImpl
あり、ファイルはフックを介してリポジトリに保存されますが、そこで多くの追加作業が行われます。
Liferay には jackrabbit-text-extractors ライブラリがないため、PDF、DOC、ODS ドキュメントからメタデータを抽出したい場合、非常に苦労することになると思います... DL サービス レイヤーは追加のプロパティを受け入れないためです。
- DL サービスと JCR フックの使用を避け、Jackrabbit に直接アクセスする必要があると思います...しかし、互換性が失われ、リポジトリなどを移行する可能性があります。
誰かこれに協力してくれませんか?ありがとうございました