データレイクとビッグデータの間に本当の違いがあるかどうかをすべて理解しようとしています.概念を確認すると、どちらも必要になるまで情報を保存するビッグリポジトリのようなものです.ビッグデータを使用していると言えるのはいつですか.またはデータレイク?
前もって感謝します
ビッグ データとデータ レイクは相互に関連する 2 つの用語ですが、まったく異なる意味を持ちます。これが、この 2 つの用語をしばしば混同する主な理由です。それでは、両者の違いを簡単に理解しましょう。
ビッグデータ 名前自体がすべてを物語っているように、ビッグデータは単純に膨大なサイズのデータです。ペタバイト以上のオーダーのデータはビッグデータと見なされます。サイズだけでなく、ビッグデータを定義するパラメーターがいくつかあります。このデータを生成するソース、データのさまざまな形式、およびデータが生成される速度、これらすべての要素を組み合わせることで、ビッグ データが定義されます。 ビッグデータとは、簡単に言えば膨大な量のデータです。それでおしまい。
データ レイク データ レイクは、ビッグ データのリポジトリです。さまざまなソースから生成された、構造化、非構造化、半構造化など、あらゆるタイプのデータを格納します。データを最も生の形式で保存します。データ レイクはデータ ウェアハウスとは異なります。データ ウェアハウスは、適切に構造化された形式でデータを格納します。データレイクに存在するデータは将来利用されるかもしれないし、利用されないかもしれませんが、データウェアハウス内のデータは利用することを意図しています。
ビッグデータは巨大なデータであり、データレイクはその貯蔵庫です。
これが役立つことを願っています。