これは DEFLATE アルゴリズムに固有の質問ですが、gzip と zlib に関連しています。
ファイル内にいくつかのフラッシュ ポイントがあることがわかっている gzip ファイルがあるとします。そのうちのいくつかは Z_SYNC_FLUSH で作成され、その他は Z_FULL_FLUSH で作成されます。ファイルをスキャンすると、0000ffff のパターンにすぐに従うため、すべてのフラッシュ ポイントを見つけることができます。
解凍に必要なすべての情報が利用可能であるため、Z_FULL_FLUSH ポイントで解凍を再開できることがわかっています (IE: 辞書がリセットされます)。ただし、Z_SYNC_FLUSH から解凍しようとすると、通常、「zlib.error: 解凍中にエラー -3: 無効な距離が遠すぎます」というエラーが発生します。
問題はこれです: Z_SYNC_FLUSH ポイントから解凍しようとすると、次のいずれかが保証されますか?
- そのブロックと後続のブロックを適切に解凍します
- 「距離が遠すぎます」エラーで失敗する
言い換えれば、不正なデータを黙って解凍しないことが保証されていますか (gzip の最後の CRC32 チェックについて話しているのではなく、zlib が大声で文句を言うかどうかについて話しているわけではありません)。
仮定:
- フラッシュポイントを完全に識別できると仮定します。ランダム ビットを同期マーカーと誤認したり、パターンがたまたまタイプ 0 ブロックに表示されたりしないと仮定しましょう。これは非現実的ですが、それが真実であると仮定してください。
- ファイルが破損することはなく、常に正規の gzip ファイルであると想定します。