私は、大量のデータを迅速に解析するプロジェクトに取り組んでいます。現在、このデータはディスク上にあり、ディレクトリ階層に分割されています。
(Folder: DataSource) -> (Files: Day1, Day2, Day3...Day1000...)
(Folder: DataSource2) -> (Files: Day1, Day2, Day3...Day1000...)
...
(Folder: DataSource1000) -> ...
...
各日ファイルは、非常に迅速にアクセスする必要があるエントリで構成されています。
私の最初の計画は、Java で従来の FileIO を使用してこれらのファイルにアクセスすることでしたが、さらに読み進めるうちに、これでは遅すぎるのではないかと心配するようになりました。
要するに、ファイルシステムからさまざまな DataSources と Days からエントリを選択的にロードできる最速の方法は何ですか?