プロジェクトで膨大な量のデータを処理します。ビッグデータの概念について読んだことはありますが、まだ使用したことはありません。しかし、これらすべてのビッグ データ ドキュメントを読んでも、自分の要件にビッグ データが必要なのか、それとも従来のリレーショナル データベースで処理するのが適切なのか、まだわかりません。
ここに私のDBに関するいくつかの情報があります。
私のメイン DB は、さまざまなデータ ソースのリポジトリです。これらのデータ ソースはそれぞれ、同じ種類のデータ (同じドメイン内のデータ) を処理しますが、一部のデータ ソースには他のフィールドでは使用できない余分なフィールドが含まれており、一部のデータ ソースには含まれていないフィールドが含まれています。つまり、これらのデータ ソースのデータ フィールドには同じものもあれば、異なるものもあります。したがって、コア DB にはこれらすべてのフィールドが含まれている必要があります。コア DB の合計フィールド数は約 2000 フィールドで、1,000 万から 2,000 万のレコードが含まれている可能性があります。
私のコア DB で行われている DB 操作は、データの挿入と読み取り (検索) です。膨大な量のデータを扱うため、ビッグデータの概念を使用することを考えていました。しかし、これがビッグデータに適しているかどうかはまだわかりません。一部のデータには同様の特性 (同じフィールド) があり、一部には追加情報が含まれているためです。そして、DB であらゆる種類の高速検索が必要です。ありがとう。