python - Python で数行の非圧縮 PDF を編集する

翻译自：https://stackoverflow.com/questions/67143633 2021-04-17T22:39:54.847

29 次

圧縮されていないpdfで数行を編集したい。同様の問題が見つかりましたが、正確な行位置を取得するためにファイルを数回スキャンする必要があるため、これは実際には適していません (正規表現一致の純粋な数は必要以上です)。pdfには、utf-8でエンコード可能な行（編集したい行、特にターゲットIDをブックマークする行）と多くのブロブ（推測画像など）が含まれています。メモ帳でファイルを編集すると正常に動作しますが、プログラムで編集すると (読み取り、数行の変更、書き戻し)、画像と一部の書式設定が失われます。(そもそも読み込まれないので、ignore-option)

with codecs.open("merged-uncompressed.pdf", "r", encoding='ascii', errors='ignore') as f:

でファイルを読み取ることができerrors="surrogateescape"、上記のインポートから行をマップしたかったのですが、このアプローチが機能するかどうかはわかりません。

これに対処する方法を知っている人はいますか？

ベスト、ルーカス

python - Python で数行の非圧縮 PDF を編集する

1 に答える 1

Related

Reference