私が遭遇したほとんどのケースは、データがHDFSの内外に移行されていた場合でした。そして、私はHadoopにまったく慣れていません!
しかし、私の要件は、単一のJCR準拠のフラットファイルリポジトリ内のさまざまなソースから大きなバイナリファイルを移動することです。私の質問は
1)Hadoopは、Xからの読み取りとYへの書き込み(両方の非HDFSシステム)シナリオに適していますか?
2)他のカスタムフレームワークまたはSpringバッチのようなものは同じ目的を果たしますか?つまり、IOとネットワークの問題にすぎないということですか?