400万を超えるドキュメントを含む大規模なデータセット用のストレージおよび検索ソリューションを実装することが期待されています。各ドキュメントには40以上のフィールド(または検索条件)があります
私は以前にLuceneとSolrを使用したことがあるので、この問題にそれらを使用する傾向があります(もちろん、他のアイデアや解決策も歓迎します)。しかし、私を悩ませているのは、効率的でスケーラブルなストレージです。私はCassandraとMongoDB、およびその他のいくつかのNoSQLソリューションを探していましたが、どのテクノロジーが要件に最適であるかを確信できませんでした。
誰かが同じような問題に直面したことがあるかどうか、そして彼女/彼がそれを解決するために使用したものを尋ねたいと思います。