問題タブ [pypdf2]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

764 問題

0 投票する

2 に答える

8540 参照

python - Python を使用して PDF からテキストを消去する方法

PDFからテキストを編集するためのpythonスクリプトを作成しています。

PDF ファイルの特定の位置にテキストを追加できるこの Python コードがあります。

私の問題:元の PDF の特定の位置にあるテキストをカスタムテキストに置き換えたいです。空白文字を書く方法でうまくいきますが、これを行うものは見つかりませんでした。

PS .:後でこれを.exeファイルとして展開する必要があり、Python コードを使用してそれを行う方法しか知らないため、Python コードである必要があります。

2017-07-17T12:26:18.823

0 投票する

4 に答える

23723 参照

python - PythonでPyPDF2マージpdfファイルを使用しているときにEOFマーカーが見つかりません

次のコードを使用すると

次のようなことが起こりました。

何が起こったのか誰か教えてくれませんか？ありがとう

python pdf pypdf2

2017-07-29T14:50:31.813

0 投票する

1 に答える

1170 参照

python - Pythonを使用してPDFでストリームを見つけて識別する

PDFからの画像抽出を自動化するために約1週間試みてきました。残念ながら、ここで見つけた答えは何の役にも立ちませんでした。pypdf2 を使用して同じコードで複数のバリエーションを見てきましたが、すべてが['/XObject']含まれており、KeyError.

私が探しているものは、ストリームに隠れているようで、pypdf2の辞書にはありません (構造全体を再帰的に探索し、.getObject()見つけたすべての間接オブジェクトを呼び出した後でも)。

を使用pypdf2して、pdf から 1 ページを書き、を使用してそれを開き、フィルターを使用Notepad++していくつかのストリームを見つけました。/FlateDecode

pdfrwAPdfReader(path).pages[page].Contents.streamストリームを取得するために使用できるようになりました（他のストリームを取得する方法はわかりません）。

を使用zlibして解凍すると、次のようなものが得られました。

(また、正と負の両方の多くの浮動小数点数が含まれています)

私が見つけたBDCものから、ゴーストスクリプトと関係があります。

この時点で私はあきらめ、助けを求めることにしました。

少なくとも、すべてのストリームを抽出する (およびFlateDecodeタグを識別する) Python ツールはありますか?

そこに何が隠されているかを特定する方法はありますか？何らかの画像形式の開始タグを期待していましたが、これは明らかにそうではありません。この結果をさらに解析して、そこに隠されている可能性のある画像を見つけるにはどうすればよいですか?

適切に表示される PDF に適用できるものを探しています。さらに解析するためのツール、または少なくともストリームを理解するのに役立つツール、または何が起こっているのかを理解するのに役立つリファレンスです。

編集：パトリックが指摘したように、私は間違ったツリーを吠えていました。xObjectsで PDF を開くときNotepad++、または PDF の解析に使用されるさまざまな python スクリプトを実行するときに何も見つからなかったので、ストリームに行きました。私は、タグのない画像であると思われるものを見つけることができましたxObjectが、情報は圧縮されていませんが、ストリームタグのように見えます.

python pdf pypdf2 pdfrw

2017-08-07T09:10:05.963

1 2 3 4 5 6 7 8 9 10

問題タブ [pypdf2]

python - Python を使用して PDF からテキストを消去する方法

python - PythonでPyPDF2マージpdfファイルを使用しているときにEOFマーカーが見つかりません

python - Pythonを使用してPDFでストリームを見つけて識別する

Reference