java - Java Berkeley DB 読み取りパフォーマンス (1 億ドキュメント)

Question

Berkeley DB JE は、1 億のドキュメントの単純なキーと値のペアを格納するのに適切な選択であるかどうか疑問に思っています。

BDB でのフェッチ時間は 75 ミリ秒未満で、1 つのドキュメントをフェッチする必要があります。

前もって感謝します

score 0 · Accepted Answer

Berkeley DBJavaEditionディスカッションフォーラムでパフォーマンス要件について話し合うことをお勧めします。主な質問は、「データを取得するために何回のI /Oを実行する必要があるか」ということになるでしょう。答えが「なし」の場合、75ミリ秒の応答時間は簡単です。答えが「多」の場合は、「多」の数とディスクドライブの速度によって異なります。

BDBJEFAQページにいくつかの優れたクイックリファレンスがあります。特に、これはすぐに役立つかもしれません。基本的に、少なくともすべてのインデックスノードがメモリに収まるようにキャッシュのサイズを設定する必要があります。インデックスノードがメモリに収まる場合、データがすでにキャッシュにない限り、データ（リーフノード）に到達するために最大で1つのI/Oを実行する必要があります。

score 0 · Accepted Answer

オープンソースの情報検索エンジンである Apache Lucene を使用してみませんか? 私は lucene を使用して index: キーワードをドキュメント ID に保持します。キーワード (またはキーワードのセット) を lucene に投稿し、ドキュメントの ID を取得し、Berkley DB からドキュメントを取得できるようになりました。

java - Java Berkeley DB 読み取りパフォーマンス (1 億ドキュメント)

2 に答える 2

Related

Reference