問題タブ [pdfrw]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

74 問題

0 投票する

1 に答える

381 参照

python - PDF フォームファイルを読み取り、入力可能なフィールド座標とフィールド名を返す

基本的にフォームであるPDFファイルがあります。入力可能な場所を返す必要があります。入力するフィールド、ページ番号、境界ボックスを配置できる座標。

私はこの問題を処理するためにさまざまなアプローチをとってきましたが、結局のところ、PDF での作業は非常に困難です。

PDF ファイルの詳細:

どちらが返されますか:

私がこれまでに行ったことは次のとおりです。ほとんどの場合、ページを読んでフォームに入力することはできますが、フォームに入力する必要はありません。フォームに入力する必要がある場所の座標を取得して、適切な場所にバウンディングボックス。

上記のコードは、マークされたフィールドで満たされた PDF を常に返すわけではなく、特に役に立ちません。ここからどこへ行けばいいのかわからない。私が自由に使えるほとんどすべてのリソースを使い果たしたので、誰かが私を助けることができれば. 私はPDFを扱うのが初めてです。

2020-02-26T07:48:22.787

0 投票する

2 に答える

752 参照

python - カスタムページ番号 (別名ページラベル) とブックマークを保持しながら PDF をマージする

複数の PDF ファイルのマージを自動化しようとしていますが、2 つの要件があります。a) 既存のブックマークと b) ページラベル (カスタムページ番号) を保持する必要があります。

PyPDF2 と pdftk ではデフォルトでマージ時にブックマークが保持されますが、pdfrw では保持されません。ページラベルは、PyPDF2、pdftk、または pdfrw では一貫して保持されません。

いろいろ検索した結果、やりたいことを実行するための直接的なアプローチはないと思います。私が間違っている場合は、誰かがこの簡単な解決策を指摘してくれることを願っています。しかし、簡単な解決策がない場合は、これを Python で実行する方法についてのヒントをいただければ幸いです。

いくつかのコード例:

1) PyPDF2 の場合

だから私はここから先に進む方法がわからない

2）pdfrwを使用（より有望）

2 番目のファイルのブックマークのページ番号は、それらを追加する前にオフセットする必要がありますが、アウトラインを読むとき、ほとんどの場合、ページ番号の代わりに (IndirectObject, XXX) を取得します。pdfrw を使用して各ラベルとブックマークのページ番号を取得する方法が不明です。だから、私は再び立ち往生しています

Z P

python pdf pypdf2 pdfrw

2020-05-11T22:10:38.863

1 2 3 4 5 6 7 8 9 10

問題タブ [pdfrw]

python - PDF フォーム ファイルを読み取り、入力可能なフィールド座標とフィールド名を返す

python - カスタム ページ番号 (別名ページ ラベル) とブックマークを保持しながら PDF をマージする

Reference

python - PDF フォームファイルを読み取り、入力可能なフィールド座標とフィールド名を返す

python - カスタムページ番号 (別名ページラベル) とブックマークを保持しながら PDF をマージする