txt ファイルに埋め込まれている uuencode された PDF ファイルをデコードしようとしています。
私たちが抱えている問題は、ほとんどの PDF ファイルが Python の uuencode ライブラリを使用してうまくデコードされたことです。コードは次のとおりです。
try:
decoded_file,m=uudecode(fileString)
except:
decoded_file=''
ただし、一部のファイルはデコード後に開くことができません。「このドキュメントを開くときにエラーが発生しました。ファイルが破損しているため、修復できませんでした。」というメッセージが表示されます。
Google で見つけた唯一のことは、ファイルが base64 を使用してエンコードされている可能性があり、Python uuencoding モジュールが base32 のみをサポートしていることです。base64 と base32 のどちらを使用して uuencode されているかを確認する方法はありますか?
正常にデコードされた uuencoded pdf が埋め込まれた txt ファイルの例を次に示し ます。
失敗したものの例を次に示し ます。
これらを Python でデコードしている間、いかなる種類のエラーもポップアップせず、すべてが正常に機能しているようです。それらが正しくデコードされない原因は何ですか? 処理中にこれにフラグを付ける方法はありますか?