apache - Apache Kylin のユースケースとは?

Question

私は最近 Apache Kylinに出会い、そのユースケースが何であるかに興味がありました。私が知る限り、これは 100 億以上の行、他のソース (HBase、Hadoop、Hive) からのデータの集約、キャッシュ、およびクエリに関連する非常に具体的な問題を解決するために設計されたツールのようです。私はこの仮定で正しいですか？

score 1 · Accepted Answer

Apache Kylin のユースケースは、Hadoop でのインタラクティブなビッグデータ分析です。3 つの簡単なステップで、1 秒未満のレイテンシーで大きな Hive テーブルをクエリできます。

スタースキーマで一連の Hive テーブルを識別します。
オフラインバッチプロセスで Hive テーブルからキューブを構築します。
SQL を使用して Hive テーブルにクエリを実行し、Rest API、ODBC、または JDBC を介してサブ秒で結果を取得します。

使用例は非常に一般的で、テーブルからスタースキーマとモデルキューブを定義できる限り、任意の Hive テーブルを高速にクエリできます。スタースキーマとキューブがよくわからない場合は、Kylin の用語を確認してください。

Kylin は ANSI SQL インターフェイスを提供するため、以前とほぼ同じ方法で Hive テーブルにクエリを実行できます。ただし、制限の 1 つは、Kylin が集計結果のみを提供することです。つまり、正しい結果を得るには、SQL に「group by」句を含める必要があります。ビッグデータ分析は、個々のレコードではなく集計結果に重点を置いているため、通常はこれで問題ありません。

apache - Apache Kylin のユースケースとは?

1 に答える 1

Related

Reference