“pypdf”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

876 参照

python - PyPdfマージエラー

PyPdfを使用して複数のPdfページを1つのページにマージするmergeTranslatedPageと、いくつかの不明な文字が表示されます。これらの不明な正方形は、最後にマージされたページに含まれていない文字です。調査の結果、この方法_merge_ressourcesはうまく機能していないと思います。ページが古いページのリソースを上書きする可能性がありますpage1.compressContentStreams()。マージするたびに試しましたが、結果はありませんでした。

このリンクには、マージされたPDFの例とPDFの結果が表示されます。

助けてください

python pypdf

2012-10-08T12:41:58.593

0 投票する

2 に答える

2896 参照

python - PDF ページ内のすべてのオブジェクトを繰り返し処理し、どのオブジェクトがテキストオブジェクトであるかを確認する方法は?

pypdf を使用して、pdf のページ内のすべてのオブジェクトを反復処理したいと考えています。

また、テキストかグラフィックかにかかわらず、オブジェクトのタイプを確認したいと思います。

コードスニペットは非常に役立ちます。

どうもありがとう

python pypdf

2012-10-20T08:15:59.070

0 投票する

0 に答える

112 参照

python - PDFFileReader が使用後に PDF を閉じない

重複の可能性：
pyPDF「PdfFileReader」クラスファイルハンドルを閉じる方法

Win 64ビットでPython 2.7を実行しています。PDFをファイルにダウンロードし、PDFを開いてテキストを抽出し、最後にPDFを削除しようとしていますが、Pythonを削除しようとするとエラーが発生します（Pythonコードを使用して手動で削除しようとしていますpdf - Windows は、ファイルが pythonw によって使用されていることを示しています)。私の簡略化されたコード:

返されたエラー:

助言がありますか？

python pdf pypdf win64

2012-10-26T06:01:58.547

0 投票する

1 に答える

3308 参照

python - PDF 裁ち落とし検出

私は現在、プリンターの適合性について PDF をテストするための小さなツール (Python + pyPdf) を作成しています。

悲しいかな、私は最初のタスクですでに混乱しています: PDF に少なくとも 3mm の「裁ち落とし」(何も印刷されていないページの境界線) があるかどうかを検出することです。グローバルなものがないように見えるため、完全なドキュメントの裁ち落としを検出できないことは既にわかっています。ただし、ページでは、合計 5 つの異なるボックスを検出できます。

mediaBox
bleedBox
trimBox
cropBox
artBox

これらのボックスに関するpyPdf のドキュメントを読みましたがmediaBox、全体のページサイズ (つまり、紙) を表していると思われるのみを理解しました。

ブリードを定義する必要があることはbleedBox明らかですが、常にそうであるとは限りません。

私が指摘したもう 1 つのことは、たとえばPDFの場合、これらのボックスはすべて各ページでまったく同じサイズ (まったく裁ち落としがないことを意味します) ですが、開くと大量の裁ち落としがあることです。これにより、個々のテキスト要素には独自のオフセットがあると思います。

したがって、明らかに、とからブリードを計算するだけでmediaBoxはbleedBox実行可能なオプションではありません。

誰かがそれらのボックスが実際に何であるか、そしてそこから私が結論できること (たとえば、あるボックスは常に別のボックスよりも小さい) に光を当てることができれば、私は非常に嬉しく思います。

おまけの質問:ドキュメントに記載されている「デフォルトのユーザー空間ユニット」が正確に何であるかを誰か教えてもらえますか? これは私のマシンで言及していると確信していますが、どこにでも適用したいと思います。mmmm

python pdf typography pypdf

2012-11-05T16:36:28.690

0 投票する

1 に答える

773 参照

python - PdfFileWriter からブロブストアファイルを作成する

PythonとGoogleアプリエンジンを使用して、2つのpdfをpyPdfライブラリとマージしようとしています。ブロブストアからファイルを読み取り、必要な情報を使用して PdfFileWriter オブジェクトを作成しますが、この PdfFileWriter をブロブストアファイルに変換するのに問題があります。それを解決するためのアイデアはありますか？ありがとうございました：）

これが私のコードです：

python file google-app-engine blobstore pypdf

2012-11-08T10:22:49.333

0 投票する

2 に答える

2708 参照

python - tkinter で GUI を使用して PDF ページを表示する

私はpyPdfを使用してpdfページをトリミングしています。そして、私が見逃しているのは、このスクリプトの GUI だけです。GUIを行うためにtkinterモジュールを手に入れましたが、tkinterで作成したGUIでpdfページを表示できるかどうかわかりません。

何かご意見は？

ありがとうございました。

python python-2.7 tkinter pypdf

2012-12-18T13:39:33.047

0 投票する

2 に答える

164 参照

python - 実際にファイルを作成せずに、変数または http URL からファイルオブジェクトを取得する方法は?

ダウンロードした PDF を PyPDF を使用して操作したいのですが、そのためにはファイルオブジェクトが必要です。

GAE を使用して Python アプリをホストしているため、実際にファイルをディスクに書き込むことができません。

URL から、またはファイルの内容を含む変数からファイルオブジェクトを取得する方法はありますか?

ティア。

python google-app-engine file-io pypdf

2012-12-18T22:41:32.980

0 投票する

0 に答える

2580 参照

python - reportlab pythonライブラリを使用してPDF印刷に透明な透かしを追加するにはどうすればよいですか

動的に生成された PDF 印刷で透かしを描画する必要があります。

私はpyPdfライブラリを使用してそれを行いました（元のPDFと透かし付きのPDFをマージすることにより）。 http://wa5pb.freeshell.org/motd/?p=769

私の問題は、reportlab ライブラリの drawImage 機能の mask パラメータを使用せずに、透かし画像を透明にする必要があることです。これは手動であるためです。助言がありますか？

ありがとう！。

python reportlab pypdf

2013-01-09T11:48:02.597

0 投票する

0 に答える

980 参照

python - PythonでPDFに「欠落している」ページを空白ページとして挿入するにはどうすればよいですか？

2、4、5番のページ（ファイルの名前はtest_002.pdf、test_004.pdf、test_005.pdf）に参加する必要があるとすると、3ページ目が欠落していると言えます。

私がやろうとしているのは、これらのコマンドの結果を取得することです。

これは、偶数ページと奇数ページを1つの一意のページに結合し、欠落しているページの代わりに空白のページ（3）を使用します。

私はそれがすべきだと思います：

受信ファイルを最初から最後までチェックして、欠落しているページを探します（この場合、2から5の欠落＃3）
オンザフライで空白の「23.5cm、30cm」PDFページを生成します（おそらくpyPdfを使用）
それらを「偶数」と「奇数」にカップルとして分類し、奇数ページですべての偶数に参加できるようにします（pdfjamを使用）…

私は正しいですか？

Pythonのいくつかの行でそれは可能ですか？または、もっと簡単な方法はありますか？

これが私が始めたことで、ホットフォルダーのように機能するようにしていますが、偶数と奇数の管理で完全に失われ、「ファイル/ページ」が欠落しています。

前もって感謝します！

python pdf pypdf

2013-01-11T15:36:50.437

0 投票する

1 に答える

4316 参照

python - PythonでPDFファイルに%%EOFを追加する

pyPdf で PDF を開こうとしています。次のエラーが表示されます。

自分でEOFを追加する必要があると思いました。しかし、私はバイトを書きたくありません。OS固有じゃない？os.eof() のようなものを呼び出したいです。何を書く？このスレッドは役に立ちません。

python pdf eof pypdf

2013-01-30T06:53:37.343

問題タブ [pypdf]

Reference