PDF ファイルを解凍すると、画像に示すような奇妙な出力が得られます。(pdfはメモ帳++で開かれます)
mupdf、pdftk、および zlib を使用してすべてのストリームを解凍する独自の .net アプリケーションなどのいくつかのライブラリとツールを使用して、これを解凍しようとしました。
これらのオプションはすべて同じ結果になります。これを読みやすくする方法を知っている人はいますか?
はい、 PDF ファイルとそれに含まれるほとんどのオブジェクトを解凍できます。
しかし、いいえ、PDF で使用できる圧縮方法は zlib だけではありません。
いいえ、正常に解凍されたすべてのオブジェクトが必ずしも単純な ASCII 文字で構成されるとは限りません。「バイナリ」の非ASCII文字がまだ含まれている可能性があります。また、バイナリ データ (圧縮されているかどうかに関係なく) は、「解凍」しても ASCII にはなりません...
データを読み取れるようにするには、エンコーディングを介してデータをマッピングする必要があります。それは WIn エンコーディング (メモ帳と同じ) のテキストとして表示されますが、それ以外の場合は表示されません。