次のタスクに適したテクノロジを推奨してください。
基本的に数値の行列であるかなり大きな (500MB) データ チャンクがあります。データのエントロピーは低く (十分に圧縮可能である必要があります)、ストレージは場所によっては高価です。
私が探しているのは、非常にまれなランダム アクセスを可能にするマーカーを使用して、適切な圧縮アルゴリズム (GZip など) で圧縮することです。「元の (圧縮されていない) ストリームの場所 [64 ビット アドレス] からバイトを読み取る」のようなランダム アクセス。これは、ストリームを継続的に解凍できる ZLIB などの従来のデフレーター ライブラリとは少し異なります。私が望むのは、たとえば、読み取りバイトあたり 1MB もの圧縮解除作業のレイテンシでランダム アクセスを行うことです。
もちろん、NIH の車輪を再発明するのではなく、既存のライブラリを使用したいと考えています。