Sqoop を使用して、HDFS から RDBMS テーブルにデータをエクスポートすることができます。しかし、既存のテーブルが必要なようです。
Sqoop に「CREATE TABLE」を実行させ、この新しく作成されたテーブルにデータをエクスポートするように指示するパラメーターはありますか?
はいの場合、Oracle と連携しますか?
申し訳ありませんが、現時点では Sqoop は RDBMS でのテーブルの作成をサポートしていません。Sqoop は RDBMS のテーブルを使用してメタデータ (列の数とそのデータ型) を取得するため、Sqoop がメタデータを取得してテーブルを作成できる場所がわかりません。
Oracleも使用していることに気付きました。Oracle を含む特定の sqoop ベンダー固有の sqoop コネクタは、これをサポートしています。Sqoop の Oracle 直接接続モードには、それを行うオプションがあります。
https://sqoop.apache.org/docs/1.4.6/SqoopUserGuide.html#_create_oracle_tables
24.8.5.4. Oracle テーブルの作成
-Doraoop.template.table=テンプレートテーブル名
TemplateTableName の構造とデータ型を複製して OracleTableName を作成します。TemplateTableName は、Sqoop コマンドを実行する前に Oracle に存在するテーブルです。
ps。--direct sqoop export オプションを使用して、sqoop ダイレクト モード = 'Data Connector for Oracle and Hadoop' (別名 OraOOP - 古い名前) を有効にする必要があります。