cassandra - 並列 get_range() phpcassa

翻译自：https://stackoverflow.com/questions/11916739 2012-08-11T18:49:20.230

203 次

map reduce に似たものを作ろうとしていますが、hadoop はありません。

それぞれが $cf->get_range($begin, $end) を実行し、すべての行を反復するために、いくつかの php プロセスを使用する予定です。

ただし、ランダムパーティショナーのため、データは並べ替えられません。これは、適切な $begin、$end 変数を実際に選択することができず、30 ～ 40 のプロセスを並行して開始することが難しいことを意味します。

Cassandra は get_range をトークンでサポートしていますが、phpcassa では公開されていません。

私にはいくつかの可能性がありますが、それらは専門家らしくないように見えないため、好きではありません。

0 に答える 0