java - Bitcaskは、シンプルで高性能なファイルストアで大丈夫ですか？

Question

何百万ものxmlファイルを保存および取得する簡単な方法を探しています。現在、すべてがファイルシステムで実行されていますが、パフォーマンスに問題があります。

要件は次のとおりです。

私はいくつかのNoSQLプラットフォーム（CouchDB、Riakなど）を調べましたが、これらのシステムは見栄えがしますが、ほとんどやり過ぎのようです。

Riakを深く掘り下げてみると、Bitcask（イントロを参照）が見つかりました。これはまさに私が望んでいるもののようです。イントロで説明されている基本は本当に興味をそそられます。しかし、残念ながら、Javaを介してビットキャスクリポジトリにアクセスする手段はありません（またはありますか？）

スー私の質問は要約すると

score 6 · Accepted Answer

Bitcaskがあなたのユースケースでうまく機能するとは思わない。Bitcaskモデルは、各値のサイズが比較的小さいユースケース向けに設計されているようです。

問題は、Bitcaskのデータファイルのマージプロセスにあります。これには、多数の「古いデータファイル」から「マージされたデータファイル」にすべてのライブ値をコピーすることが含まれます。それぞれ100Kbの領域に数百万の値がある場合、これは非常に大量のデータコピーです。

上記は、XMLドキュメントが比較的頻繁に更新されることを前提としていることに注意してください。更新がまれである場合、および/または大量のスペースの「無駄」に対処できる場合は、マージを行う必要があるのはまれであるか、まったく必要ない場合があります。

score 4 · Accepted Answer

大量の上書きがあるかどうかに応じて、この場合（大きな値）にはビットキャスクが適切な場合があります。特に、新しい値が古い値と同じキーで到着した場合にのみ発生する大量の無駄なスペースがない限り、ファイルをマージする理由はありません。

Bitcaskは、着信データストリームをディスクに直接書き込むため、このバッチロードの場合に特に適しています。ほとんどの場合、ルックアップには1回のシークが必要ですが、一時的な局所性がある場合はファイルキャッシュが役立ちます。

Javaバージョン/ラッパーのステータスがわかりません。

2 に答える 2