問題タブ [pdfrw]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
381 参照

python - PDF フォーム ファイルを読み取り、入力可能なフィールド座標とフィールド名を返す

基本的にフォームであるPDFファイルがあります。入力可能な場所を返す必要があります。入力するフィールド、ページ番号、境界ボックスを配置できる座標。 

私はこの問題を処理するためにさまざまなアプローチをとってきましたが、結局のところ、PDF での作業は非常に困難です。 

PDF ファイルの詳細:

どちらが返されますか:

私がこれまでに行ったことは次のとおりです。ほとんどの場合、ページを読んでフォームに入力することはできますが、フォームに入力する必要はありません。フォームに入力する必要がある場所の座標を取得して、適切な場所にバウンディング ボックス。

上記のコードは、マークされたフィールドで満たされた PDF を常に返すわけではなく、特に役に立ちません。ここからどこへ行けばいいのかわからない。私が自由に使えるほとんどすべてのリソースを使い果たしたので、誰かが私を助けることができれば. 私はPDFを扱うのが初めてです。

0 投票する
2 に答える
752 参照

python - カスタム ページ番号 (別名ページ ラベル) とブックマークを保持しながら PDF をマージする

複数の PDF ファイルのマージを自動化しようとしていますが、2 つの要件があります。a) 既存のブックマークと b) ページラベル (カスタム ページ番号) を保持する必要があります。

PyPDF2 と pdftk ではデフォルトでマージ時にブックマークが保持されますが、pdfrw では保持されません。ページラベルは、PyPDF2、pdftk、または pdfrw では一貫して保持されません。

いろいろ検索した結果、やりたいことを実行するための直接的なアプローチはないと思います。私が間違っている場合は、誰かがこの簡単な解決策を指摘してくれることを願っています。しかし、簡単な解決策がない場合は、これを Python で実行する方法についてのヒントをいただければ幸いです。

いくつかのコード例:

1) PyPDF2 の場合

だから私はここから先に進む方法がわからない

2)pdfrwを使用(より有望)

2 番目のファイルのブックマークのページ番号は、それらを追加する前にオフセットする必要がありますが、アウトラインを読むとき、ほとんどの場合、ページ番号の代わりに (IndirectObject, XXX) を取得します。pdfrw を使用して各ラベルとブックマークのページ番号を取得する方法が不明です。だから、私は再び立ち往生しています

Z P