1

現在、ファイルシステムに保存されている数十万の PDF があります。実際の目的を後から考えて、これらの PDF へのアクセスを提供するカスタム アプリケーションがあります。カスタム アプリケーションから「ストレージと検索」の部分を取り除き、OpenSource ドキュメント ストレージ バックエンドを使用したいと考えています。

PDF ストアへのアクセスは REST API 経由で行う必要があります。これにより、ユーザーは基本的なドキュメントのブラウジングと表示にカスタム クライアントを必要としなくなります。PDF を保存するプログラムは、REST API 経由でも動作できる必要があります。それらは実際のバイナリまたは ASCII データと構造化されたメタ データを提供し、後で検索に使用できます。

検索の典型的なクエリは、「ドキュメント タイプ A または B で X 日から Y 日の間に作成されたすべてのドキュメントをください」です。

そのようなストレージ バックエンドが存在するかどうかについての私の調査は、空っぽになりました。これらの機能を提供するシステムを知っている人はいますか? オープンソースが優先し、合理的な価格のシステムが考慮されます。

利用可能なテクノロジーを使用して「自分でロールバック」する方法についてのアドバイスを求めているわけではありません。むしろ、それを回避できるかどうかを調べようとしています。よろしくお願いします。

4

1 に答える 1

1

あなたの説明は、ドキュメント管理または資産管理システムのように聞こえますが、それらには多くのものがあります。多くの場合、PDF ファイルを操作します。Xinet (http://www.northplains.com/xinet - 現在は買収されたようです) や Elvis (http://www.elvisdam.com) などの商用製品について、つかの間の経験があります。どちらも要件に適合する可能性がありますが、サイズが大きすぎたり、価格が高すぎたりする可能性があります。

アルフレスコを見たことがありますか?これは、私が何年も前に選考委員会の委員会に参加していたときに接触したオープンソースの代替案です。私が覚えている限り、それは間違いなくあなたが探している方向に進んでおり、オープンソースであるため、その角度にも合うかもしれません: http://www.alfresco.com .

于 2012-12-04T23:43:39.910 に答える