大量のドキュメント (PDF、Word ファイルなど) を保存する必要があるシステムに取り組んでいます。Solr/Lucene を使用して、これらのドキュメントから抽出された適切な情報を検索していますが、元のドキュメントを保存する場所も必要です。ファイルをユーザーが開いたりダウンロードしたりできるようにします。
私はいくつかの可能性について考えていました:
- ファイル システム - 100 万個のドキュメントを保存するのはおそらく良い考えではありません
- SQLデータベース - しかし、バイナリドキュメントとそのIDのみを保存する必要があるため、リレーショナル機能のほとんどは必要ないため、これが最速のソリューションではない可能性があります
- no-sql データベース - 経験がないので、どちらが良いかわかりません。また、多くのデータベースがあるため、どれを選択すればよいかわかりません。
私が探しているストレージは次のとおりです。
- 速い
- スケーラブル
- オープンソース (重要ではありませんが、あると便利です)
これらのファイルを保存する最良の方法は何だと思いますか?