2

map reduce に似たものを作ろうとしていますが、hadoop はありません。

それぞれが $cf->get_range($begin, $end) を実行し、すべての行を反復するために、いくつかの php プロセスを使用する予定です。

ただし、ランダム パーティショナーのため、データは並べ替えられません。これは、適切な $begin、$end 変数を実際に選択することができず、30 ~ 40 のプロセスを並行して開始することが難しいことを意味します。

Cassandra は get_range をトークンでサポートしていますが、phpcassa では公開されていません。

私にはいくつかの可能性がありますが、それらは専門家らしくないように見えないため、好きではありません。

  1. すべてのキーを単一の行に配置し、その後 ColumnSlice() + multiget() を使用します。
  2. すべてのキーを単一の行に配置しますが、MD5 値を使用します。次に、MD5 値でキーを取得し、get_range() を実行します。
  3. セカンダリインデックスで同様のことをする
  4. すべてのキーを Redis にインポートします。
4

0 に答える 0