オン プリミズ Hadoop クラスター (ローカル ネットワーク内) に一定量のデータがあり、Amazon クラウド S3 Hadoop クラスターに一定量のデータがあります。どちらの場所でも、データはハイブ テーブルに存在します。
ローカルの Hadoop クラスターからハイブ クエリを起動したいのですが、このクエリは、ローカル クラスターのハイブ テーブルからのデータと、Amazon s3 Hadoop クラスターからのハイブ テーブルのデータを結合する必要があります。両方の場所からデータを結合し、結果を提供する必要があります
ローカルのハイブ シェルからクエリを発行しているため、ローカル クラスター環境に。
この問題は Amazon Data Pipeline で処理できますか? はいの場合は、道を案内してください。
ありがとう、 -スヨーダ