現在、ファイルシステムに保存されている数十万の PDF があります。実際の目的を後から考えて、これらの PDF へのアクセスを提供するカスタム アプリケーションがあります。カスタム アプリケーションから「ストレージと検索」の部分を取り除き、OpenSource ドキュメント ストレージ バックエンドを使用したいと考えています。
PDF ストアへのアクセスは REST API 経由で行う必要があります。これにより、ユーザーは基本的なドキュメントのブラウジングと表示にカスタム クライアントを必要としなくなります。PDF を保存するプログラムは、REST API 経由でも動作できる必要があります。それらは実際のバイナリまたは ASCII データと構造化されたメタ データを提供し、後で検索に使用できます。
検索の典型的なクエリは、「ドキュメント タイプ A または B で X 日から Y 日の間に作成されたすべてのドキュメントをください」です。
そのようなストレージ バックエンドが存在するかどうかについての私の調査は、空っぽになりました。これらの機能を提供するシステムを知っている人はいますか? オープンソースが優先し、合理的な価格のシステムが考慮されます。
利用可能なテクノロジーを使用して「自分でロールバック」する方法についてのアドバイスを求めているわけではありません。むしろ、それを回避できるかどうかを調べようとしています。よろしくお願いします。