RDBMSテーブルからリモートHiveマシンにデータをインポートする必要があります。Sqoopを使用してこれを実現するにはどうすればよいですか?
ナットシェルで、インポートコマンドでハイブデータベース名とハイブマシンi / pを指定するにはどうすればよいですか?
適切なsqoopコマンドを手伝ってください。
およびその他のステートメントの実行を探すためsqoop
、Hiveがインストールされているマシンでコマンドを実行する必要があります。sqoop
$HIVE_HOME/bin/hive
CREATE TABLE ...
または、コマンドラインオプションを使用sqoop
して--hive-home
、Hiveをインストールする場所を指定することもできます(オーバーライドするだけです$HIVE_HOME
) 。
リモートRDBMSに接続するには:
sqoop import --connect jdbc:mysql://remote-server/mytable --username xxx --password yyy
Hiveにインポートするには:
sqoop import --hive-import
http://archive.cloudera.com/cdh/3/sqoop/SqoopUserGuide.html#_literal_sqoop_import_literal">このリンクを参照すると、コマンドのより包括的なリストを取得できます。