インタラクティブ モードでエラスティック mapreduce で Hive を実行しました。
./elastic-mapreduce --create --hive-interactive
スクリプトモードでは:
./elastic-mapreduce --create --hive-script --arg s3://mybucket/myfile.q
自分のサーバーにアプリケーション (できれば PHP、R、または Python) を配置して、エラスティック mapreduce クラスターを起動し、解析可能な形式で出力を取得しながらいくつかの Hive コマンドを実行できるようにしたいと考えています。
クラスターのスピンアップには時間がかかることはわかっているので、アプリケーションは別のステップでそれを実行し、クラスターの準備が整うまで待つ必要があるかもしれません。しかし、このやや具体的な仮説の例のようなことをする方法はありますか?
- Hive テーブル customer_orders を作成します
- Hive クエリ「SELECT dt, count(*) FROM customer_orders GROUP BY dt」を実行します。
- 結果を待つ
- PHP で結果を解析する
- Hive クエリ「SELECT MAX(id) FROM customer_orders」を実行します。
- 結果を待つ
- PHPで結果を解析...
これをどのように行うかについての推奨事項はありますか?