列名がタイムスタンプである「タイムライン」インデックスとして使用される幅広い列ファミリがあります。ホットスポットを防ぐために、CF を月ごとにシャーディングして、CF に各月の行が存在するようにします。
2 つの日付の間のスライス範囲について CF にクエリを実行し、1 ページあたりのページのレコードに基づいて返される列の数を 10 に制限します。
問題は、日付範囲が数か月にわたる場合、最初の行に 10 個の一致する列がある場合でも、各行から 10 個の列が返されるため、ページングの要件を満たすことです。
これでロジックを確認できますが、行数に関係なく最初の 10 列の一致する列のみが必要な場合に、潜在的に複数のノードから冗長なレコードを取得する必要がある場合、実際には非効率であると私は思います。
したがって、私の質問は、最初の呼び出しで 10 件のレコードが返されない場合、最初の行で 1 つの Get 操作を実行してから、2 番目の行で別の Get 操作を実行し、必要な番号が得られるまで続けたほうがよいのでしょうか。のレコード (または行制限に達する)、または単に冗長性を受け入れて不要なレコードをダンプしますか?