FileSystem.get はスレッド セーフではないため、代わりに FileSystem.newInstance を使用します。しかし、HDFS への接続が必要なたびに newInstance メソッドを呼び出すのは、良い考えではないかもしれません。そこで、FileSystem 接続プールを作成しました。
これが最初の質問です。
これは良いアプローチですか?
私はHiveのソースをチェックしていますが、彼らはこのアプローチを使用していません。HDFS API を直接使用するだけで、newInstance を使用することさえありません。なんで?彼らはどのように新しいファイルシステム接続を作成しますか?
FileSystem.close() も使用しません。
FileSystemが閉じることをどのように保証しますか?