問題タブ [pypdf2]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python-3.x - pypdf2 で pdf を書き込むとエラーが発生する
2 つの PDF をマージする簡単なスクリプトを作成しようとしていますが、出力をディスクに保存しようとすると問題が発生します。私のコードは
問題は、次のエラーが発生することです
UserWarning: 書き込み先のファイルはバイナリ モードではありません。正しく書き込まれていない可能性があります。[pdf.py:453] トレースバック (最新の呼び出しが最後): ファイル "Combine2Pdfs.py"、44 行目、output.write(output_name) ファイル "/Library/Frameworks/Python.framework/Versions/3.5/lib/pytho n3.5/site-packages/P yPDF2/pdf.py"、487 行目、書き込み stream.write(self. header + b ("\n")) の TypeError: write() 引数は str である必要があります。バイト
どこで間違ったのですか?
python-3.x - PyPDF2 は PDF を間違ったフォントまたはエンコーディングでマージします
PyPDF2 を使用して、PDF ファイルのページを再フォーマットしています。私の目標は、ソース PDF ファイルから 2 ページを取得し、これらのページが 1 つの横向きページに収まるように縮小された新しい PDF ファイルを出力することです。私は次のコードを使用しています:
出力は私の予想とほぼ一致しますが、カーニングが悪く、いくつかの特殊文字が正しく表示されない別のフォントを使用しているようです。私は PDF 形式の内部構造に詳しくないので、何が原因なのかわかりません。
コンテンツをソースとまったく同じ方法で (縮小する以外は) 表示するにはどうすればよいですか?
regex - 正と負の数値を持つ PyPDF2 および DataFrame からの文字列内の括弧付きの正規表現
私は現在、PyPDF2 を介して PDF を文字列にプルし、その PDF を括弧内の費用の正規表現で検索するスクリプトを使用しています。次に、これらの費用が合計され、pd.DataFrame で操作され、結果が CSV ファイルに出力されます。
払い戻しが発行されるまで、すべて問題ありませんでした。基本的に、括弧内に含まれるすべての費用と、re を使用して x 費用を検索します。
これは、totalFees のリストに追加されました。
その後、リストは操作のために DataFrame に変換されます。
最近、PDF の形式が変更され、追加の経費文字列が含まれるようになりました。これは、場合によっては返金となる場合もあります。re で検索する文字列はそのように見えます
また
私の最初の問題は括弧にあります。次のことを試してみましたが役に立ちませんでした
しかし、空のリストを返します[]
か? 私はいくつかの re を試しましたが、どれも機能していないようです。
私の次の問題は、以前はすべての費用 (マイナスの金額) でしたが、現在は払い戻しにプラスの値が含まれています。これは、DataFrame の計算を台無しにします。これをどのように解決すればよいでしょうか。かっこ内の以前の費用に戻り、次のような方法でマイナスにすることができます。
そして、正の金額を引き出すと、DataFrame が正しく計算され、費用が減り、払い戻しが追加されます。
それとも、別のルーツに従う方が賢明でしょうか?
このコードは、これまで見た中で最も Pythonic ではないかもしれませんが、この 1 年間はうまく機能しています。
python - PyPDF2 - 2 つの異なる PDF ファイルからのページのマージが機能しない
2 つの PDF ファイルのページを、1 ページの 1 つの PDF に結合しようとしています。そこで、PyPDF2 を使用する以下のコードを試しました。
ファイル1からページ1の内容を含む単一のファイルと単一のページを生成しますが、ファイル2のページ1からのデータは見つかりません。合併しなかったようです。