Google Dremelのホワイト ペーパーを読んでいます。複雑なデータを列状のデータレイアウトに変換することを知りました。
このデータはどの場所に保存されますか?
Drill には中央のメタデータ リポジトリがないため、in-memoryにある必要があると思います。
したがって、何十億もの行がある場合、Drill はこのデータをどのように処理するのでしょうか?
Google Dremelのホワイト ペーパーを読んでいます。複雑なデータを列状のデータレイアウトに変換することを知りました。
このデータはどの場所に保存されますか?
Drill には中央のメタデータ リポジトリがないため、in-memoryにある必要があると思います。
したがって、何十億もの行がある場合、Drill はこのデータをどのように処理するのでしょうか?
数十億行から完全で一貫したクエリ結果を取得するには、複数のドリルビットに接続された分散ファイル システムを使用するか、各ノードにファイルをコピーして分散ファイル システムをシミュレートするか、Amazon Elastic File System などの NFS ボリュームを使用します。Drill は、次のようなさまざまな手法を使用して、ビッグ データのパフォーマンスの高いクエリを実行します。
詳細については、http://drill.apache.org/docs/performance/ を参照してください。