java - 400万以上のドキュメントの保存と検索

Question

400万を超えるドキュメントを含む大規模なデータセット用のストレージおよび検索ソリューションを実装することが期待されています。各ドキュメントには40以上のフィールド（または検索条件）があります

私は以前にLuceneとSolrを使用したことがあるので、この問題にそれらを使用する傾向があります（もちろん、他のアイデアや解決策も歓迎します）。しかし、私を悩ませているのは、効率的でスケーラブルなストレージです。私はCassandraとMongoDB、およびその他のいくつかのNoSQLソリューションを探していましたが、どのテクノロジーが要件に最適であるかを確信できませんでした。

誰かが同じような問題に直面したことがあるかどうか、そして彼女/彼がそれを解決するために使用したものを尋ねたいと思います。

score 1 · Accepted Answer

一般的な参考資料として、この調査用紙を確認してください。

ドキュメント指向データストアの調査、利用可能ないくつかのメトリック
http://cattell.net/datastores/Datastores.pdf

IEEEサブスクライバーの場合：

NoSQL評価：ユースケース指向の調査
http://www.computer.org/portal/web/csdl/doi/10.1109/CSC.2011.6138544
http://ieeexplore.ieee.org/xpl/login.jsp?tp3%arnumber = 6138544＆url = http％3A％2F％2Fieeexplore.ieee.org％2Fxpls％2Fabs_all.jsp％3Farnumber％3D6138544

java - 400万以上のドキュメントの保存と検索

1 に答える 1

Related

Reference