1 週間以上経過した (シェル スクリプトからシェル コマンドを呼び出していた) ループ内で hdfs からファイルとディレクトリを繰り返し削除するユーティリティを作成しているときに、パフォーマンスの問題に直面しました。また、削除する前に各ファイル/サブディレクトリに対して特定のチェックを実行する必要があったため、ルートディレクトリ全体を削除することはできませんでした。削除ごとに、シェル コマンドは約 2 秒かかりました。そのため、1600 個のファイルとサブディレクトリを削除する必要がある場合、それらを完了するのに 1 時間近くかかりました。代わりに JAVA API (FileStatus および FileSystem) を使用すると、パフォーマンスが大幅に向上しました。5秒以内に完了しました。その根本的な理由を詳しく知りたいです。シェル コマンド (-rm など) が内部的に JAVA API を使用することを読みましたが、それが応答時間のこの大きな違いの唯一の理由ですか?
質問する
402 次