lucene でいくつかの RDBMS 機能を実現できるかどうかは疑問です。
例: 1) 10,000 個のプロジェクト ドキュメント (pdf ファイル) があり、それらのコンテンツを検索できるようにインデックスを作成する必要があります。2) すべてのドキュメントは SINGLE PROJECT に関連付けられています。プロジェクトには、プロジェクト名、番号、開始日、終了日、場所、タイプなどの詳細を含めることができます。
特定のキーワードでpdfファイルの内容を検索する必要がありますが、結果を表示しながら、ポイント(2)で述べたようにプロジェクトのメタデータを表示したいと考えています。
私の考えは、索引付け中に projectId というフィールドを各 pdf ファイルに関連付けることです。それを取得したら、プロジェクトのメタデータを取得するために検索を再度実行します。
このようにして、データの重複を避けることができました。また、プロジェクトのメタデータを更新したい場合は、単一の場所でのみ更新することになります。それ以外の場合、このメタデータをすべての pdf ドキュメント インデックスと共に保存すると、すべてのドキュメントが更新されてしまいます。これは、私が探している方法ではありません。
お知らせ下さい。