私は、時間的 (YYYYMMDDHHmm) と空間的 (経度、緯度) の両方に配置された 50k から 100k のデータポイントを毎日インポートするプロジェクトに取り組んでおり、ユーザーが設定したクエリパラメーターに従って動的にマップにレンダリングします。特定のズーム レベル以下では、事前に計算されたクラスターを使用します。
この文脈の中で、ストレージ レイヤー用のデータベース エンジンを選択しているという事実を考慮して、私は現在、Cassandra と BigTable のバリアントを評価しています。
具体的には、Cassandra で複合パーティション キーを使用する場合と、GeoMesa が使用するような BigTable でインターリーブされたインデックス キーを使用する場合の違いを理解しようとしています。
私が理解している限り、これらのアプローチはどちらも COTS ハードウェアを活用でき、ホットスポットを減らしてスペース充填を最大化するように調整できます。
この 2 つを区別するために従うべき論理的な手順は何ですか? 近い将来、両方のアプローチをテストする予定ですが、より合理的で教育を受けたアプローチを聞きたいと思っています。