問題タブ [pypdf]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - pyPdfでページを分割し、間違ったページサイズを取得する
私はpyPdf
pdfページを分割するために使用しています。すべて正常に動作しますが、ページ サイズは同じではありません。
元のページサイズ: 1000px
次のコマンドでページサイズを確認しました: (w, h) = p.mediaBox.upperRight
. なぜupperLeft
間違っているのですか?
python - PythonでPDFページのサイズを変更する
私はpythonを使ってpdfページを切り取っています。すべて正常に動作しますが、ページ サイズ (幅) を変更するにはどうすればよいですか?
これは私のトリミングコードです:
ページをトリミングするとき、サイズも変更する必要があります。どうすればよいですか?
python - pdfファイルをpypdfとマージする
インターネットサイト(maya.tase.co.il)でリンクを解析し、PDFファイルをダウンロードして、それらをマージするスクリプトを書いています。ほとんどの場合は機能しますが、マージするとファイルに応じてさまざまな種類のエラーが発生します。理由がわからないようです。関連するコードを切り取り、問題を引き起こしている2つの特定のファイルに対してのみテストを作成しました。スクリプトはpypdfを使用しますが、機能するものは何でも試してみます。一部のファイルは暗号化されていますが、暗号化されていないものもあります。
これを読むのに時間を割いてくれた人に感謝します。アル。
python - Pythonpypdfを閉じる際の問題-書き込み。valueErrorの取得:閉じたファイルに対するI/O操作
pypdfを使用してWebページから生成されたpdfファイルをマージすることになっているこの関数(インターネットサイトをpdfにスクレイピングするためのクラスの一部)を理解することはできません。
これはメソッドコードです:
私はこのエラーを受け取り続けます:
しかし、self._pdfstreamのステータスを確認すると、次のようになります。
私は何が間違っているのですか?
助けていただければ幸いです
python - 特定の単語でPDFファイルを複数のPDFファイルに分割する方法は?
私は1つのpdfファイルを持っています。そのファイルの特定の単語でそのファイルを複数のpdfファイルに分割したい。どうすればPythonでそれを行うことができますか?
python - Python スクリプトの実行に関する問題 (pypdf/hex エラー)
PyPDF モジュールを使用して Python スクリプトを作成しようとしています。スクリプトは、「ルート」フォルダーを取得し、その中のすべての PDF を結合し、結合された PDF を「出力」フォルダーに出力し、その名前を「Root.pdf」(分割された PDF を含むフォルダー) に変更します。次に、サブディレクトリについても同じことを行い、最終出力にサブディレクトリと同じ名前を付けます。
サブディレクトリを処理しようとすると行き詰まり、一部の 16 進数値に関連するエラー コードが表示されます。(16進数ではないnull値を取得しているようです)
生成されたエラー コードは次のとおりです。
これは、スクリプトのソース コードです。
python - PyPDFのPdfFileReader()でファイルの読み取りに問題があり、ファイルを呼び出せません
これが私のインポートです:
これが私が自分のPDFを書いたものです:
(素晴らしい命名規則、私は知っています!)
私はそれにいくつかのことを書きます。
ここで閉じます:
これが私がそれを読んでみるところです:
そしてここにエラーがあります:
ファイルが存在することがわかっているので、エラーを理解できません。この行とそれに続くinput1の行をコメントアウトすると、プログラムは正常に実行されます。
python - 私のコードがスキャンした PDF のすべてのページを正しく分割しないのはなぜですか?
更新:スクリプトが機能する startdt に感謝します! pdfは別のページです。他のスクリプトでスクリプトを試してみましたが、各 pdf ページも正しく吐き出しましたが、ページ番号の順序が正しい場合と間違っている場合があります。たとえば、pdf ファイルの 25 ~ 28 ページでは、印刷されたページ番号は 14、15、17、16 です。PDF 全体はhttp://download304.mediafire.com/u6ewhjt77lzg/bgf8uzvxatckycn/3.pdfからダウンロードできます。
オリジナル:スキャンした pdf があります。2 つの紙のページが 1 つの pdf ページに並んでいます。PDFページを2つに分割したいと思います。元の左半分が2つの新しいPDFページの前になります。pdfは次のようになります。
Gillesun2up
にインスパイアされた名前の Python スクリプトを次に示します。
コマンドを使用してターミナルのpdfでスクリプトを試しましたun2up < page.pdf > out.pdf
が、出力out.pdf
が正しく分割されません。
変数w
との値h
、 の出力もチェックしましたp.mediaBox.upperRight
が、それらは514
と1224
であり、実際の比率に基づいて正しく見えません。
ファイルはhttp://download851.mediafire.com/bdr4sv7v5nzg/raci13ct5w4c86j/page.pdfからダウンロードできます。
attributes - NameError:属性をパラメーターとしてメソッドに渡すときに、名前'self'が定義されていません
pyPdfを使用してPDFを編集する小さなプログラムで問題が発生しています。PDFの最後のページ(self.lastpage)をデフォルトのパラメーターとしてクラスメソッド(pageoutput)に渡そうとしています。これを行うと、次のエラーが発生します。
end_pageとして数値を指定するだけでは機能しますが、属性を使用すると失敗します。このエラーは私には不可解な賭けです。pdfの最後のページを問題なく印刷できるので、pypdfでは問題ないようです。何が起こっているのかについての洞察をいただければ幸いです。
これが私のコードです(それが重要な場合は、3.x互換バージョンのpypdfを使用しています):
django - djangoを介したhttpresponseとしてのpyPDFのマージと表示
2 つの pdf ファイルを私の django サイトにマージする pyPDF ロジックを組み込むのに問題があります。ローカル サーバー上の python ファイルで実行されたときにファイルをマージするように機能するコードを作成しました (ただし、マージするファイルを明示的に識別する必要があります。
このコード (私の django サイトから) は、単一の PDF を表示するために機能します。ただし、複数の PDF を選択すると、最後に選択した PDF のみが表示されるため、pyPDF を統合して、要求されたすべてのファイルを含む 1 つのファイルを作成する必要があります。
これら2つの方法を組み合わせる方法を見つけるのに苦労しています。私が試したのは次のとおりですが、IO エラー [Errno 2] No such file or directory: 'obj.form' が発生します。したがって、obj.form を読み取っていません。これらのオブジェクトを正しく読み取る方法を見つける必要があります。とにかく、これは私が試したことです。
いつものように、あなたが提供できる助けやヒントをありがとう!