.net - PDFの問題を解凍する

Question

ここに画像の説明を入力

PDF ファイルを解凍すると、画像に示すような奇妙な出力が得られます。（pdfはメモ帳++で開かれます）

mupdf、pdftk、および zlib を使用してすべてのストリームを解凍する独自の .net アプリケーションなどのいくつかのライブラリとツールを使用して、これを解凍しようとしました。

これらのオプションはすべて同じ結果になります。これを読みやすくする方法を知っている人はいますか？

score 1 · Accepted Answer

はい、 PDF ファイルとそれに含まれるほとんどのオブジェクトを解凍できます。

しかし、いいえ、PDF で使用できる圧縮方法は zlib だけではありません。

いいえ、正常に解凍されたすべてのオブジェクトが必ずしも単純な ASCII 文字で構成されるとは限りません。「バイナリ」の非ASCII文字がまだ含まれている可能性があります。また、バイナリデータ (圧縮されているかどうかに関係なく) は、「解凍」しても ASCII にはなりません...

score 0 · Accepted Answer

データを読み取れるようにするには、エンコーディングを介してデータをマッピングする必要があります。それは WIn エンコーディング (メモ帳と同じ) のテキストとして表示されますが、それ以外の場合は表示されません。

2 に答える 2