問題タブ [pdftk]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - PDF が検索可能かどうかをプログラムで判断するにはどうすればよいですか?
PDF を含む URL のリストを含む CSV があります。
- これらの PDF の一部は検索可能です。
- これらの PDF の一部は検索できません。
PDF のリストから検索可能な PDF を特定したいと考えています。これを行う簡単な方法はありますか?
android - モバイルデバイスの Django で動的 PDF を提供する方法
を使用しpdftk
て、いくつかの動的な一時 PDF ファイルを生成し、Django がユーザーに提供します。
デスクトップでは正常に動作します-pdfファイルが開き、ユーザーは保存できますが、すべてのブラウザーのAndroid携帯で(iOSでも同じかもしれませんが、iOSデバイスがないためテストできません)、pdfは機能します正常にダウンロードされません。ダウンロードを開始しますが、その後常に失敗し、その理由がわかりません。
以下は、pdf バイナリ データを生成するビューと関数のスニペットです。
なぜこれが起こっているのかについてのアイデアはありますか?
vbscript - pdftkを使用して複数の場所にあるPDFをマージする
バッチまたはVBSスクリプトファイルから複数のPDFを呼び出すpdftkをマージしようとしています。問題は、PDFがすべて共通の親ディレクトリ内のサブフォルダにあることです。例:親フォルダー> subfolder1、subfolder2、subfolder3、ここで、script / BATファイルは親フォルダーにあり、各サブフォルダーにはPDFが含まれています。
pdftkは次のように呼び出されます:pdftk.exe * .pdf cat output OutputFile.pdf
これにより、現在のディレクトリにあるPDFのみがマージされ、サブフォルダにはマージされません。次のいずれかを行う方法はありますか?
- VBS / BATファイルを使用して、サブフォルダー内のすべてのPDFを別のディレクトリーにコピーし、一部のサブフォルダーが空の場合でもエラーアウトしないようにします。
- pdftkにサブフォルダーを調べて、マージするPDFを選択してもらいます
どんな助けでもいただければ幸いです。
php - PHP を使用して HTML フォーム データを PDF ファイルに変換する
私はこれを数日間調べてテストしており、誰かが私を別の方向に向けることができるかどうか疑問に思っていました. 非常に長い求人応募 HTML フォーム (jobapp.html) と一致する PDF (jobpdf.pdf) があり、HTML フォームと PDF の両方のすべてのエントリに同じフィールド名があります。フォームに入力されたユーザー データを取得して PDF に変換する必要があります。これは私がこれまでに集めたものですが、軌道に乗っているかどうかはわかりません:
pdftk は、これを達成するための唯一の実行可能なサードパーティ アプリですか?
pdftk を使用すると、ユーザー用に収集された $_POST データを取得して .fdf(user.fdf) を生成し、.pdf(job.pdf) で .fdf を平坦化します。フィールドが各ドキュメントのどこにあるかに関係なく、fdf の情報はフィールド名で pdf に入力されますか?
私はhttp://koivi.com/fill-pdf-form-fields/tutorial.php を試しています
「 HTMLフォームをPDFに送信する」も見ました
php - PHPを使用してhtmlフォームからPDFに移動
重複の可能性:
PDF フォームへの PHP の入力
私はこれを数日間調べてテストしており、誰かが私を別の方向に向けることができるかどうか疑問に思っていました. 非常に長い求人応募 HTML フォーム (jobapp.html) と一致する PDF (jobpdf.pdf) があり、HTML フォームと PDF の両方のすべてのエントリに同じフィールド名があります。フォームに入力されたユーザー データを取得して PDF に変換する必要があります。これは私がこれまでに集めたものですが、軌道に乗っているかどうかはわかりません:
pdftk は、これを達成するための唯一の実行可能なサードパーティ アプリですか?
pdftk を使用すると、ユーザー用に収集された $_POST データを取得して .fdf(user.fdf) を生成し、.pdf(job.pdf) で .fdf を平坦化します。フィールドが各ドキュメントのどこにあるかに関係なく、fdf の情報はフィールド名で pdf に入力されますか?
php - pdftk ユーティリティを使用した PHP exec() のセキュリティ
PHPスクリプトから呼び出してpdftk (pdftツールキット)を使用することに興味があります。exec()
その機能を利用したいと考えています。コマンドは次の形式に従います。
pdftk [form_file] fill_form [data_file] output [output_file] flatten
このコマンドは、フォーム PDF ファイル ( form_file
) を取得し、FDF データを挿入しdata_file
、フォームをフラットにして として保存しoutput_file
ます。
次のような関数を介してこのコマンドの実行を保護するために私が考えていることは次のとおりですexec()
- ディレクトリ名とファイル名はユーザー定義ではありません。ディレクトリ名とファイル名は、サニタイズされた識別子文字列に基づいて生成され、英数字、ダッシュ、アンダースコア、およびピリオドのみが含まれます。識別子文字列は、制限された実用的な長さになります。
- 引数 (ファイル名) は
escapeshellarg()
、コマンドに連結される前に渡されます (ただし、進行するステップに脆弱性がない場合、これはおそらく不要です)。 - コマンド全体が渡され
escapeshellcmd()
ます。
このコマンドの実行に関して、セキュリティ上の脆弱性を見落としていませんか? (今考えられる唯一のことは、pdftk 自体に脆弱性があり、それがファイルを処理する方法であるかどうかです。) このプロセスを改善するための提案はありますか? ありがとう。
cmd - 共有ファイル サーバーで pdftk を実行する
共有ファイル サーバーに pdftk をインストールしましたが、サーバー自体から正常に動作します。
ファイルサーバーにアクセスできるが、pdftk自体がインストールされていない別のコンピューターからpdftkを実行することは可能ですか?
どんな助けでも大歓迎です。
php - pdftkを使用したPHPでのバルクテンプレートベースのPDF生成
テンプレートに基づいてPDFファイルを大量に生成していますが、パフォーマンスの大きな問題がすぐに発生しました。私の現在のシナリオは次のとおりです。
- dbから入力するデータを取得します
- 単一のデータ行とPDFフォームに基づいてfdfを作成します
.fdf
ファイルをディスクに書き込む- pdftkを使用してpdfをfdfとマージします(flattenコマンドを使用したfill_form)
.pdf
すべてのが生成されるまで、行を繰り返し処理し続けます- 生成されたすべてのファイルが最終的にマージされ、単一のpdfがクライアントに提供されます
私passthru
はクライアントに生の出力を提供するために使用します(ファイルの書き込み時間を節約します)が、これはパフォーマンスのほんの少しの改善です。総動作時間は200レコードで約50秒ですが、なんらかの形で少なくとも10秒に短縮したいと思います。
理想的なシナリオは、これらすべてのpdfをメモリ内で操作し、それらのすべてを個別のファイルに書き込まないことですが、そのようなデータをpdftkなどの外部ツールに渡すことができないため、出力を行うことは不可能です。もう1つのアイデアは、.fdf
これらすべての行を含む1つの大きなファイルを生成することでしたが、それは許可されていないようです。
私はここで非常に些細なことを見逃していますか?
アドバイスをありがとうございます。
PS。pdflibのような優れたライブラリを使用できることはわかっていますが、現在はオープンライセンスライブラリのみを検討しています。
編集:
テンプレートとして同じPDFを使用して複数のページでファイルを作成するための構文を理解しようとしてい.fdf
ますが、数時間かかり、適切なドキュメントが見つかりませんでした。
pdf - Ghostscriptスクリプトまたはその他、2つの複数ページのPDFファイルから奇数ページと偶数ページをインターリーブする
スキャナーに給紙がありますが、両面スキャンがありません。したがって、シートの両面に印刷されている複数ページのドキュメントをスキャンすると、2つのpdfファイルが作成されます。1つはすべて奇数ページ(奇数ページpdfファイル)、もう1つはすべて偶数ページ(偶数ページのPDFファイル)。
偶数ページのpdfファイルの各ページが1ページおきに奇数ページのpdfファイルに追加されるように、2つのファイルをマージするGhostscriptスクリプトを作成できるはずだと思います。
誰かがそれを行う方法を知っていますか?
できれば、スクリプトは引数を取るので、最初の引数は出力ファイルを指定し、2番目の引数は奇数ページのpdfファイルを指定し、3番目の引数は偶数ページのpdfファイルを指定します。
python - 大きな .pdf を複数のファイルに分割しようとしています。(python、pdftk)
章/ブックマークごとに .pdf を分割するスクリプトを Python で作成しました。これが基本的に私のプログラムの核心です:
ツールキットはうまく機能しますが、何度も呼び出すのは明らかに時間効率の良い作業ではありません。200MB の .pdf ファイルの解析には 15 秒から 20 秒かかり、30 の個別の章にまたがると長い時間がかかります。実際にデータを書き込むよりも、ファイルを開くのに多くの時間が費やされます。
ツールキット内で複数のコマンドを文字列化する固有の方法がないように思われるため、これを回避できるようにする (つまり、.pdf を開いたままにする) Python または CMD でプルできるメモリのトリックはありますか? 別のモジュールも検討します (ただし、 pyPdfには独自の多くの問題があります)。