1) sqoop import-allコマンドを使用しています。
2)ローカルで利用可能な sqoop ソースから分散Hadoop クラスターにETL を実行したいシナリオがあります... ETL を開始するマシンは JDBC ソースにアクセスできますが、クラスター上のすべてのスレーブが持つ保証はありませんJDBC ソースへのアクセス。
私の質問は:
単一の JDBC 接続からすべてのデータをストリーミングするように Sqoop を構成する方法はありますか (おそらく、これは 1 つのマッパーのみを使用することを意味しますが、mapreduce 構成ハッカーを実行するのではなく、sqoop にこれを行うように指示したいと考えています)。