問題タブ [pdfrw]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - PDF フォーム ファイルを読み取り、入力可能なフィールド座標とフィールド名を返す
基本的にフォームであるPDFファイルがあります。入力可能な場所を返す必要があります。入力するフィールド、ページ番号、境界ボックスを配置できる座標。
私はこの問題を処理するためにさまざまなアプローチをとってきましたが、結局のところ、PDF での作業は非常に困難です。
PDF ファイルの詳細:
どちらが返されますか:
私がこれまでに行ったことは次のとおりです。ほとんどの場合、ページを読んでフォームに入力することはできますが、フォームに入力する必要はありません。フォームに入力する必要がある場所の座標を取得して、適切な場所にバウンディング ボックス。
上記のコードは、マークされたフィールドで満たされた PDF を常に返すわけではなく、特に役に立ちません。ここからどこへ行けばいいのかわからない。私が自由に使えるほとんどすべてのリソースを使い果たしたので、誰かが私を助けることができれば. 私はPDFを扱うのが初めてです。
python - カスタム ページ番号 (別名ページ ラベル) とブックマークを保持しながら PDF をマージする
複数の PDF ファイルのマージを自動化しようとしていますが、2 つの要件があります。a) 既存のブックマークと b) ページラベル (カスタム ページ番号) を保持する必要があります。
PyPDF2 と pdftk ではデフォルトでマージ時にブックマークが保持されますが、pdfrw では保持されません。ページラベルは、PyPDF2、pdftk、または pdfrw では一貫して保持されません。
いろいろ検索した結果、やりたいことを実行するための直接的なアプローチはないと思います。私が間違っている場合は、誰かがこの簡単な解決策を指摘してくれることを願っています。しかし、簡単な解決策がない場合は、これを Python で実行する方法についてのヒントをいただければ幸いです。
いくつかのコード例:
1) PyPDF2 の場合
だから私はここから先に進む方法がわからない
2)pdfrwを使用(より有望)
2 番目のファイルのブックマークのページ番号は、それらを追加する前にオフセットする必要がありますが、アウトラインを読むとき、ほとんどの場合、ページ番号の代わりに (IndirectObject, XXX) を取得します。pdfrw を使用して各ラベルとブックマークのページ番号を取得する方法が不明です。だから、私は再び立ち往生しています
Z P