1

次の機能を備えた最適な圧縮アルゴリズムは何ですか?

  • 解凍にかかる時間が短くなるはずです(圧縮にかなり時間がかかる場合があります)
  • ソートされたデータを圧縮できるはずです(約3,000,000の文字列/整数のリスト...)

指標とともに提案してください:圧縮率、圧縮と解凍のアルゴリズムの複雑さ(可能であれば)?

4

4 に答える 4

11

圧縮ベンチマーク専用のサイト全体はこちら

于 2008-12-22T18:22:16.240 に答える
1

減圧時間を気にする必要はありません。より高い圧縮レベルで費やされた時間は、ほとんどの場合、最長の一致パターンを見つけることです。

減圧どちらか

1) Writes the literal 
2) for (backward position, length)=(m,n) pair, 
   goes back, in the output buffer, m bytes, 
   reads n bytes and 
   writes n bytes at the end of the buffer.

したがって、解凍時間は圧縮レベルとは無関係です。そして、Universal Decompression Virtual Machine (RFC3320) での私の経験から、どの解凍アルゴリズムにも同じことが当てはまると思います。

于 2008-12-22T18:45:52.527 に答える
1

速度だけが必要な場合は、標準の ZIP 圧縮で十分であり、言語/フレームワークに既に統合されている可能性が最も高いです (例: .NET にはそれがあり、Java にはそれがあります)。場合によっては、最も普遍的なソリューションが最適な場合もあります。ZIP は非常に成熟した形式であり、ZIP ライブラリとアプリケーションは他のものと連携して動作します。

しかし、より良い圧縮が必要な場合は、7-Zipをお勧めします。作成者は非常に頭が良く、簡単に入手でき、人々にこの形式を使用するように勧めているからです。

ハードウェアに直接関係するため、圧縮時間を提供することは不可能です。ベンチマークが必要な場合は、自分で行う必要があります。

于 2008-12-22T18:20:41.173 に答える
0

これは興味深い質問です。このような文字列と整数の並べ替えられたデータでは、差分コーディング圧縮アプローチが、 LZ77 や LZ78 などのすぐに使用できるテキスト圧縮アプローチよりも圧縮率の点で優れていると予想されます。汎用エンコーダは、データの特別なプロパティを使用しません。

于 2012-12-04T12:52:01.817 に答える