3

私は最近 Apache Kylinに出会い、そのユースケースが何であるかに興味がありました。私が知る限り、これは 100 億以上の行、他のソース (HBase、Hadoop、Hive) からのデータの集約、キャッシュ、およびクエリに関連する非常に具体的な問題を解決するために設計されたツールのようです。私はこの仮定で正しいですか?

4

1 に答える 1

1

Apache Kylin のユース ケースは、Hadoop でのインタラクティブなビッグ データ分析です。3 つの簡単なステップで、1 秒未満のレイテンシーで大きな Hive テーブルをクエリできます。

  1. スター スキーマで一連の Hive テーブルを識別します。
  2. オフライン バッチ プロセスで Hive テーブルからキューブを構築します。
  3. SQL を使用して Hive テーブルにクエリを実行し、Rest API、ODBC、または JDBC を介してサブ秒で結果を取得します。

使用例は非常に一般的で、テーブルからスター スキーマとモデル キューブを定義できる限り、任意の Hive テーブルを高速にクエリできます。スター スキーマとキューブがよくわからない場合は、Kylin の用語を確認してください。

Kylin は ANSI SQL インターフェイスを提供するため、以前とほぼ同じ方法で Hive テーブルにクエリを実行できます。ただし、制限の 1 つは、Kylin が集計結果のみを提供することです。つまり、正しい結果を得るには、SQL に「group by」句を含める必要があります。ビッグ データ分析は、個々のレコードではなく集計結果に重点を置いているため、通常はこれで問題ありません。

于 2016-03-13T04:34:13.880 に答える