いくつかのマップ タスクに対して適切な方法で HBase 行を分散するのに苦労しています。私の目的は、行キーを使用してスキャンを分割し、一連の行をそれぞれマップ ジョブに配布することです。
今のところ、マッパーが一度に 1 行ずつ取得するスキャンを定義することしかできません。しかし、それは私が望むものではありません-マップ入力セットが必要です。
私のHBaseテーブルを分割する可能性はありますか?n セットの行にスキャンし、n マッパーに入力しますか?
n個のファイルを書き込むMapReduceジョブと、これらのセットを取得するためのテキスト入力としてそれらを再度読み取るための別のMapReduceジョブを開始するソリューションを探していません。
前もって感謝します!