同様の質問があります 大規模なデータ - ストレージとクエリ しかし、私の質問はさらに難しいと思います。
問題を単純化するために、巨大なデータ セットがあります。各レコードに 3 つのフィールドがあるとします。
日付、場所、オブジェクト
オブジェクトがどの日にどの場所を訪れるかを意味します。
毎日、5000 万の新しいレコードが存在する可能性があります。100 日分のデータを保持する必要があります。
クエリは次のようなものです。
- 日付範囲を指定して、特定の場所 X を訪れたすべてのオブジェクトをリストします。
- 日付範囲を指定して、特定のオブジェクトが訪れたすべての場所をリストします。
これをどのように設計すればよいですか?解決策を与えることは可能ですか?試してみるべきツールはありますか?mongodb または hadoop を使用できますか?
さらに、クエリはフロントエンドからクエリされるため、クエリにそれほど時間はかかりません。
ありがとう。