0

パフォーマンス分析の実行と、ピッグ ラテン スクリプトとハイブ スクリプトの改善に関する優れたチュートリアルを探しています。

4

2 に答える 2

0

私はそのようなチュートリアルを知りません。私の見解では、唯一の良い方法は、データとケースを念頭に置いて自分で行うことです。

そうは言っても、パフォーマンスのボトルネックが見つかった場合は、 TPC-Hなどを使用してクエリをベンチマークし、その結果に基づいて Pig および Hive クエリを改善および最適化できます。これは、Pig と Hive の何が苦手なのかを理解するのにも役立ちます。また、特定のタスクにどちらを使用するか迷った場合に備えて、両方のツールを比較できます。

詳細については、以下の指定されたリンクにアクセスしてください。

  • Pig Ticketで TPC-H ベンチマークを実行します。
  • Pig Ticketで TPC-H ベンチマークを実行します。

また、すべての詳細が必要な場合は、Running TPC-H on Pig and Hiveに関する元の論文にアクセスできます。これらの書類には多くの情報が含まれており、プロセス中に役立つことは間違いありません。

HTH

于 2013-09-13T15:09:13.040 に答える