こんにちは、Oracle と SQL Server にテーブルがあります。Spring XD を使用して、oracle および sql サーバーから Pivotal HAWQ にデータをロードする必要があります。ドキュメントで見つかりませんでした。
3 に答える
sqoop ジョブを Spring XD と統合する必要があります。springxd を使用した sqoop ジョブについては、以下のリンクを参照してください。
jdbchdfs ジョブを使用して、HDFS のデータを CSV または PXF でサポートされている形式としてロードできます。次に、PXF 外部テーブル サポートを使用して、ロードされたデータを HAWQ テーブルにマップできます。このデータをネイティブ HAWQ テーブルにロードする必要がある場合は、そこから SELECT INSERT を実行するか、PXF 外部テーブルから HAWQ ネイティブにデータをロードする別のバッチ ジョブとして SELECT INSERT を構成することができます。
Outsourcer は、もともと Oracle および SQL Server から Greenplum にデータをロードするために設計された別のオープン ソース ソリューションですが、HAWQ もサポートするように少し前に拡張されました。
ドキュメントとダウンロードはすべてhttp://www.pivotalguru.com/にあります。
ソース コードに興味がある場合は、https ://github.com/pivotalguru/outsourcer をご覧ください。