問題タブ [pypdf]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
614 参照

python - 各シートに複数の論理ページを含むPDFドキュメントを分割するにはどうすればよいですか?

2x2のPDFドキュメントを元のページに分割したいと思います。各ページは、この例のように配置された4つの論理ページで構成されています。

私は使用しようとしていpythonますpypdf

残念ながら、このスクリプトは4つおきの論理ページを4回出力するため、意図したとおりに機能しません。私はこれまでPythonで何も書いたことがないので、おそらくコピー操作が原因で、非常に基本的な問題だと思います。助けていただければ幸いです。


編集:まあ、私はいくつかの実験をしました。次のように、ページの幅と高さを手動で挿入しました。

このコードは私の元のコードと同じ間違った結果につながります、今行をコメントアウトすると(w, h) = p.mediaBox.upperRight、すべてが機能します!理由がわかりません。タプル(w, h)はもう使用されていません。その定義を削除すると、どのように何かが変わるのでしょうか。

0 投票する
1 に答える
4220 参照

pypdf - Python PyPDF - EOF マーカーが見つかりません

次のようなことをすることについて話している他の記事を見たことがあります。

しかし、これは私にはうまくいきません。なぜそうなのか、誰にも手がかりがありますか?このサイトや他のサイトで検索していますが、まだ答えが見つかりません。Backtrack Linux で Python を使用しています。

0 投票する
1 に答える
618 参照

python - マージ時に PyPDF2 がエラーをスローする (Python3.3/Win7)

PyPDF2 を使用して、PDF の簡単なマージを行っています。XP/Python 3.2 でコードを書きましたが、問題なく動作します。これを Win7-64bit/Python 3.3 に移動し、最新の PyPDF2 ディストリビューション ( https://github.com/knowah/PyPDF2/ ) を使用すると、合併オブジェクトに PDF を追加するときに次のエラーがスローされます。

Python 3.2 を使用してクリーン インストールを試みましたが、同じエラーが発生しました。

奇妙なのは、私の XP インストールと Win7 の間で merger.py が大きく異なることですが、以前のバージョンの PyPDF2 への参照が見つからず、そのバージョンをどこからダウンロードしたか覚えていません。 18/12/12。私が見る限り、当時から現在までの間に PyPDF2 の更新はありませんでした。

Win7 へのインストールでは、標準の「python setup.py build」を使用してから「install」を使用しました。

何か案は?

0 投票する
1 に答える
2314 参照

python - 非標準の PDF を pyPdf とマージする

いくつかの PDF ファイルを 1 つの PDF ドキュメントに結合したいと考えています。結局のところ、入力ファイルは完全には標準に準拠していません。EOF マーカーの後には、いくつかの追加情報が続きます。

明らかに、これによりpyPdfで例外が発生します

ここでの質問は次のとおりです。どうすればよいですか。おそらく、各ファイルを開き、最後の 2 行を削除して保存してから、それらを pyPdf にスローすることができます。しかし、私はその考えがあまり好きではありません。多分そこにもっと良いオプションがありますか?

0 投票する
0 に答える
846 参照

python - pypdfエラー-モジュールオブジェクトに属性番号がありません

これが私が使っているコードです

このコードを実行すると、エラーが発生します。

上記のコードを実行したときに取得した出力全体のスクリーンショットを、エラーとすべてを含めて撮りました。だから、見て、何が悪いのか教えてください。

ここに画像の説明を入力してください

コードで使用import decimalした後、いくつかのエラーが発生しました。そこで、全体のスクリーンショットを撮り、ここに添付します。 ここに画像の説明を入力してください

0 投票する
1 に答える
1610 参照

python - 「10 進数のインポート」でエラーが発生する

ここに私が使用しているコードがあります

さて、このコードを実行すると、エラーが発生します: モジュール 'object' には属性 'Number' がありません

上記のコードを実行したときに得られた出力全体のスクリーンショットを、エラーとすべてを含めて撮りました。だから、見てみて、何が悪いのか教えてください。

ここに画像の説明を入力

0 投票する
0 に答える
602 参照

python - PyPDF2はpdfファイルヘッダーをインポートできません

PyPDF2 を使用して、PDF ファイルを文字列で Python にインポートします。問題は、最初のページの上部がインポートされたくないことです (.getPage(0).extractText() は上部を見逃しています)。

ヘッダー プロパティがあると思いますが、その名前が見つからず、インターネット上で情報を見つけることができませんでした。

方法や情報をどこで見つけられるか知っていますか?

0 投票する
1 に答える
27556 参照

python - PythonでPDFファイルからテキストを抽出するには?

PythonでPDFファイルからテキストを抽出するにはどうすればよいですか?

私は次のことを試しました:

ただし、結果は、読み取り可能なテキストではなく、次のようになります。

728;ˇˆ˜ ˚ˇˇ!""˘ˇˆ˙ˆ˝˛˛˛˛ˆ˜ˆ ˆˆ˘ˆ˛˙ˆ"ˆ˘"ˆˆˆ˜#$˙ˆ˚ˆ %&ˆ ˘˛ˆ˜'˙˙% ˝˛ˆˇ˙ ˜ˆˆ˜'ˆ ˇˆ#$%&('%$&))$ $+%#,-.+&&˝())˝) ˝+,,-./012)(˝)* ˝+,-3˙ˆ/0245)6#57+82,55)6#57+,+2,+ /!#!!&˘˘1"%˘20˛˛3ˆ07%4!˘"6 ˛ ^ ˝ˆ ˆ˘&/&4"9ˆ %6ˇ%4%4&5˘2)˘˘˛%:6(

0 投票する
2 に答える
1228 参照

python - 大きなキャンバス上のpyPDFでPDFをマージする

私がpyPDFでやろうとしているのは、17x11のPDF「キャンバス」を生成し、最初のPDFを左側に、2番目のPDFを右側に追加するスクリプトを作成することです。

私の最初の質問は、元の PDF の寸法を共有しない出力 PDF を生成する方法は何ですか? IE: 17x11 の PDF を生成するにはどうすればよいですか?

私のPDFガイド