問題タブ [pypdf]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 各シートに複数の論理ページを含むPDFドキュメントを分割するにはどうすればよいですか?
2x2のPDFドキュメントを元のページに分割したいと思います。各ページは、この例のように配置された4つの論理ページで構成されています。
私は使用しようとしていpythonますpypdf:
残念ながら、このスクリプトは4つおきの論理ページを4回出力するため、意図したとおりに機能しません。私はこれまでPythonで何も書いたことがないので、おそらくコピー操作が原因で、非常に基本的な問題だと思います。助けていただければ幸いです。
編集:まあ、私はいくつかの実験をしました。次のように、ページの幅と高さを手動で挿入しました。
このコードは私の元のコードと同じ間違った結果につながりますが、今行をコメントアウトすると(w, h) = p.mediaBox.upperRight、すべてが機能します!理由がわかりません。タプル(w, h)はもう使用されていません。その定義を削除すると、どのように何かが変わるのでしょうか。
pypdf - Python PyPDF - EOF マーカーが見つかりません
次のようなことをすることについて話している他の記事を見たことがあります。
しかし、これは私にはうまくいきません。なぜそうなのか、誰にも手がかりがありますか?このサイトや他のサイトで検索していますが、まだ答えが見つかりません。Backtrack Linux で Python を使用しています。
python - マージ時に PyPDF2 がエラーをスローする (Python3.3/Win7)
PyPDF2 を使用して、PDF の簡単なマージを行っています。XP/Python 3.2 でコードを書きましたが、問題なく動作します。これを Win7-64bit/Python 3.3 に移動し、最新の PyPDF2 ディストリビューション ( https://github.com/knowah/PyPDF2/ ) を使用すると、合併オブジェクトに PDF を追加するときに次のエラーがスローされます。
Python 3.2 を使用してクリーン インストールを試みましたが、同じエラーが発生しました。
奇妙なのは、私の XP インストールと Win7 の間で merger.py が大きく異なることですが、以前のバージョンの PyPDF2 への参照が見つからず、そのバージョンをどこからダウンロードしたか覚えていません。 18/12/12。私が見る限り、当時から現在までの間に PyPDF2 の更新はありませんでした。
Win7 へのインストールでは、標準の「python setup.py build」を使用してから「install」を使用しました。
何か案は?
python - 非標準の PDF を pyPdf とマージする
いくつかの PDF ファイルを 1 つの PDF ドキュメントに結合したいと考えています。結局のところ、入力ファイルは完全には標準に準拠していません。EOF マーカーの後には、いくつかの追加情報が続きます。
明らかに、これによりpyPdfで例外が発生します。
ここでの質問は次のとおりです。どうすればよいですか。おそらく、各ファイルを開き、最後の 2 行を削除して保存してから、それらを pyPdf にスローすることができます。しかし、私はその考えがあまり好きではありません。多分そこにもっと良いオプションがありますか?
python - pypdfエラー-モジュールオブジェクトに属性番号がありません
これが私が使っているコードです
このコードを実行すると、エラーが発生します。
上記のコードを実行したときに取得した出力全体のスクリーンショットを、エラーとすべてを含めて撮りました。だから、見て、何が悪いのか教えてください。

コードで使用import decimalした後、いくつかのエラーが発生しました。そこで、全体のスクリーンショットを撮り、ここに添付します。

python - 「10 進数のインポート」でエラーが発生する
ここに私が使用しているコードがあります
さて、このコードを実行すると、エラーが発生します: モジュール 'object' には属性 'Number' がありません
上記のコードを実行したときに得られた出力全体のスクリーンショットを、エラーとすべてを含めて撮りました。だから、見てみて、何が悪いのか教えてください。

python - PyPDF2はpdfファイルヘッダーをインポートできません
PyPDF2 を使用して、PDF ファイルを文字列で Python にインポートします。問題は、最初のページの上部がインポートされたくないことです (.getPage(0).extractText() は上部を見逃しています)。
ヘッダー プロパティがあると思いますが、その名前が見つからず、インターネット上で情報を見つけることができませんでした。
方法や情報をどこで見つけられるか知っていますか?
python - PythonでPDFファイルからテキストを抽出するには?
PythonでPDFファイルからテキストを抽出するにはどうすればよいですか?
私は次のことを試しました:
ただし、結果は、読み取り可能なテキストではなく、次のようになります。
728;ˇˆ˜ ˚ˇˇ!""˘ˇˆ˙ˆ˝˛˛˛˛ˆ˜ˆ ˆˆ˘ˆ˛˙ˆ"ˆ˘"ˆˆˆ˜#$˙ˆ˚ˆ %&ˆ ˘˛ˆ˜'˙˙% ˝˛ˆˇ˙ ˜ˆˆ˜'ˆ ˇˆ#$%&('%$&))$ $+%#,-.+&&˝())˝) ˝+,,-./012)(˝)* ˝+,-3˙ˆ/0245)6#57+82,55)6#57+,+2,+ /!#!!&˘˘1"%˘20˛˛3ˆ07%4!˘"6 ˛ ^ ˝ˆ ˆ˘&/&4"9ˆ %6ˇ%4%4&5˘2)˘˘˛%:6(
python - 大きなキャンバス上のpyPDFでPDFをマージする
私がpyPDFでやろうとしているのは、17x11のPDF「キャンバス」を生成し、最初のPDFを左側に、2番目のPDFを右側に追加するスクリプトを作成することです。
私の最初の質問は、元の PDF の寸法を共有しない出力 PDF を生成する方法は何ですか? IE: 17x11 の PDF を生成するにはどうすればよいですか?
