問題タブ [pypdf]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
252 参照

python - pyPdfでページを分割し、間違ったページサイズを取得する

重複の可能性:
私のコードがスキャンした PDF のすべてのページを正しく分割しないのはなぜですか?

私はpyPdfpdfページを分割するために使用しています。すべて正常に動作しますが、ページ サイズは同じではありません。

元のページサイズ: 1000px

次のコマンドでページサイズを確認しました: (w, h) = p.mediaBox.upperRight. なぜupperLeft間違っているのですか?

0 投票する
3 に答える
13066 参照

python - PythonでPDFページのサイズを変更する

私はpythonを使ってpdfページを切り取っています。すべて正常に動作しますが、ページ サイズ (幅) を変更するにはどうすればよいですか?

これは私のトリミングコードです:

ページをトリミングするとき、サイズも変更する必要があります。どうすればよいですか?

0 投票する
2 に答える
5056 参照

python - pdfファイルをpypdfとマージする

インターネットサイト(maya.tase.co.il)でリンクを解析し、PDFファイルをダウンロードして、それらをマージするスクリプトを書いています。ほとんどの場合は機能しますが、マージするとファイルに応じてさまざまな種類のエラーが発生します。理由がわからないようです。関連するコードを切り取り、問題を引き起こしている2つの特定のファイルに対してのみテストを作成しました。スクリプトはpypdfを使用しますが、機能するものは何でも試してみます。一部のファイルは暗号化されていますが、暗号化されていないものもあります。

これを読むのに時間を割いてくれた人に感謝します。アル。

0 投票する
1 に答える
4487 参照

python - Pythonpypdfを閉じる際の問題-書き込み。valueErrorの取得:閉じたファイルに対するI/O操作

pypdfを使用してWebページから生成されたpdfファイルをマージすることになっているこの関数(インターネットサイトをpdfにスクレイピングするためのクラスの一部)を理解することはできません。

これはメソッドコードです:

私はこのエラーを受け取り続けます:

しかし、self._pdfstreamのステータスを確認すると、次のようになります。

私は何が間違っているのですか?

助けていただければ幸いです

0 投票する
1 に答える
450 参照

python - 特定の単語でPDFファイルを複数のPDFファイルに分割する方法は?

私は1つのpdfファイルを持っています。そのファイルの特定の単語でそのファイルを複数のpdfファイルに分割したい。どうすればPythonでそれを行うことができますか?

0 投票する
1 に答える
784 参照

python - Python スクリプトの実行に関する問題 (pypdf/hex エラー)

PyPDF モジュールを使用して Python スクリプトを作成しようとしています。スクリプトは、「ルート」フォルダーを取得し、その中のすべての PDF を結合し、結合された PDF を「出力」フォルダーに出力し、その名前を「Root.pdf」(分割された PDF を含むフォルダー) に変更します。次に、サブディレクトリについても同じことを行い、最終出力にサブディレクトリと同じ名前を付けます。

サブディレクトリを処理しようとすると行き詰まり、一部の 16 進数値に関連するエラー コードが表示されます。(16進数ではないnull値を取得しているようです)

生成されたエラー コードは次のとおりです。

これは、スクリプトのソース コードです。

0 投票する
1 に答える
3647 参照

python - PyPDFのPdfFileReader()でファイルの読み取りに問題があり、ファイルを呼び出せません

これが私のインポートです:

これが私が自分のPDFを書いたものです:

(素晴らしい命名規則、私は知っています!)

私はそれにいくつかのことを書きます。

ここで閉じます:

これが私がそれを読んでみるところです:

そしてここにエラーがあります:

ファイルが存在することがわかっているので、エラーを理解できません。この行とそれに続くinput1の行をコメントアウトすると、プログラムは正常に実行されます。

0 投票する
3 に答える
2604 参照

python - 私のコードがスキャンした PDF のすべてのページを正しく分割しないのはなぜですか?

更新:スクリプトが機能する startdt に感謝します! pdfは別のページです。他のスクリプトでスクリプトを試してみましたが、各 pdf ページも正しく吐き出しましたが、ページ番号の順序が正しい場合と間違っている場合があります。たとえば、pdf ファイルの 25 ~ 28 ページでは、印刷されたページ番号は 14、15、17、16 です。PDF 全体はhttp://download304.mediafire.com/u6ewhjt77lzg/bgf8uzvxatckycn/3.pdfからダウンロードできます。

オリジナル:スキャンした pdf があります。2 つの紙のページが 1 つの pdf ページに並んでいます。PDFページを2つに分割したいと思います。元の左半分が2つの新しいPDFページの前になります。pdfは次のようになりここに画像の説明を入力ます。

Gillesun2upにインスパイアされた名前の Python スクリプトを次に示します。

コマンドを使用してターミナルのpdfでスクリプトを試しましたun2up < page.pdf > out.pdfが、出力out.pdfが正しく分割されません。

変数wとの値h、 の出力もチェックしましたp.mediaBox.upperRightが、それらは5141224であり、実際の比率に基づいて正しく見えません。

ファイルはhttp://download851.mediafire.com/bdr4sv7v5nzg/raci13ct5w4c86j/page.pdfからダウンロードできます。

0 投票する
2 に答える
2084 参照

attributes - NameError:属性をパラメーターとしてメソッドに渡すときに、名前'self'が定義されていません

pyPdfを使用してPDFを編集する小さなプログラムで問題が発生しています。PDFの最後のページ(self.lastpage)をデフォルトのパラメーターとしてクラスメソッド(pageoutput)に渡そうとしています。これを行うと、次のエラーが発生します。

end_pageとして数値を指定するだけでは機能しますが、属性を使用すると失敗します。このエラーは私には不可解な賭けです。pdfの最後のページを問題なく印刷できるので、pypdfでは問題ないようです。何が起こっているのかについての洞察をいただければ幸いです。

これが私のコードです(それが重要な場合は、3.x互換バージョンのpypdfを使用しています):

0 投票する
2 に答える
3888 参照

django - djangoを介したhttpresponseとしてのpyPDFのマージと表示

2 つの pdf ファイルを私の django サイトにマージする pyPDF ロジックを組み込むのに問題があります。ローカル サーバー上の python ファイルで実行されたときにファイルをマージするように機能するコードを作成しました (ただし、マージするファイルを明示的に識別する必要があります。

このコード (私の django サイトから) は、単一の PDF を表示するために機能します。ただし、複数の PDF を選択すると、最後に選択した PDF のみが表示されるため、pyPDF を統合して、要求されたすべてのファイルを含む 1 つのファイルを作成する必要があります。

これら2つの方法を組み合わせる方法を見つけるのに苦労しています。私が試したのは次のとおりですが、IO エラー [Errno 2] No such file or directory: 'obj.form' が発生します。したがって、obj.form を読み取っていません。これらのオブジェクトを正しく読み取る方法を見つける必要があります。とにかく、これは私が試したことです。

いつものように、あなたが提供できる助けやヒントをありがとう!