0

私はこのビッグデータの世界に不慣れです。コース プロジェクトとして、私はセンサー ネットワークに取り組んでおり、センサー データを HBase に保存したいと考えています。現在、データは MySQL データベースに保存されています。このデータを HBase にロードしようとしています。しかし、データは急速に増加しており、それに対するクエリは非常に遅くなっています。MYSQL テーブル スキーマは次のとおりです: SensorLog(sensorID, userID,time,date)。したがって、このテーブルはセンサー起動ログを保存します。各ユーザー (合計 45 ユーザー) に対して、彼のアパートには 25 個のモーション センサーがあります。ユーザーがアパート内を移動するたびにセンサーが作動し、このイベントがこのテーブルに記録されます。主な問題は、特定の時間間隔と日に特定のユーザーに対してどのセンサーが起動したかです。
threeHBase スキーマを思いついたので、それらについてご意見をお聞きしたいと思っています。これらのスキーマでは、時間を 1 日の秒数、つまり 0 ~ 86400 の範囲の整数として表します。

Schema1: 行キー: 日付; 列ファミリー: 時間 { cq:(t0-t86400); cv:(ユーザーID,センサーID)}

スキーマ 2: 行キー: (日付、ユーザー ID); 列ファミリー: 時間 { cq:(t0-t86400); cv:(センサーID)}

スキーマ 3: 行キー: (日付、ユーザー ID); 列ファミリー: 時間 { cq:(s1-s25); cv:(時間)}

どのスキーマがより優れていて効率的か教えてください。事前に助けていただければ幸いです。

4

1 に答える 1