AWS Oracle RDS インスタンスの 1 つのテーブル (最大 70 億行) に膨大な量のデータがあります。最終結果は、EMR に読み込むことができるように、S3 に格納されたパイプ区切りの値としてそのテーブルが必要です。これは基本的に 1 回限りのことなので、正確に機能する必要があり、何かがタイムアウトしたためにアップロード全体を再実行する必要はありません。それがどのように機能するか、セットアップがどれほど難しい/面倒かはあまり気にしません。私は Oracle ボックスで root アクセス権を持っています。Data Pipelines を見ましたが、MySQL のみをサポートしているようで、Oracle と連携する必要があります。また、テーブル全体を Oracle インスタンスの CSV にダンプしてからアップロードするのに十分なハード ドライブ容量がありません。どうすればこれを行うことができますか?