次の機能を備えた最適な圧縮アルゴリズムは何ですか?
- 解凍にかかる時間が短くなるはずです(圧縮にかなり時間がかかる場合があります)
- ソートされたデータを圧縮できるはずです(約3,000,000の文字列/整数のリスト...)
指標とともに提案してください:圧縮率、圧縮と解凍のアルゴリズムの複雑さ(可能であれば)?
次の機能を備えた最適な圧縮アルゴリズムは何ですか?
指標とともに提案してください:圧縮率、圧縮と解凍のアルゴリズムの複雑さ(可能であれば)?
圧縮ベンチマーク専用のサイト全体はこちら
減圧時間を気にする必要はありません。より高い圧縮レベルで費やされた時間は、ほとんどの場合、最長の一致パターンを見つけることです。
減圧どちらか
1) Writes the literal
2) for (backward position, length)=(m,n) pair,
goes back, in the output buffer, m bytes,
reads n bytes and
writes n bytes at the end of the buffer.
したがって、解凍時間は圧縮レベルとは無関係です。そして、Universal Decompression Virtual Machine (RFC3320) での私の経験から、どの解凍アルゴリズムにも同じことが当てはまると思います。
速度だけが必要な場合は、標準の ZIP 圧縮で十分であり、言語/フレームワークに既に統合されている可能性が最も高いです (例: .NET にはそれがあり、Java にはそれがあります)。場合によっては、最も普遍的なソリューションが最適な場合もあります。ZIP は非常に成熟した形式であり、ZIP ライブラリとアプリケーションは他のものと連携して動作します。
しかし、より良い圧縮が必要な場合は、7-Zipをお勧めします。作成者は非常に頭が良く、簡単に入手でき、人々にこの形式を使用するように勧めているからです。
ハードウェアに直接関係するため、圧縮時間を提供することは不可能です。ベンチマークが必要な場合は、自分で行う必要があります。
これは興味深い質問です。このような文字列と整数の並べ替えられたデータでは、差分コーディング圧縮アプローチが、 LZ77 や LZ78 などのすぐに使用できるテキスト圧縮アプローチよりも圧縮率の点で優れていると予想されます。汎用エンコーダは、データの特別なプロパティを使用しません。