問題タブ [pdftk]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
5908 参照

python - PDF が検索可能かどうかをプログラムで判断するにはどうすればよいですか?

PDF を含む URL のリストを含む CSV があります。

  • これらの PDF の一部は検索可能です。
  • これらの PDF の一部は検索できません。

PDF のリストから検索可能な PDF を特定したいと考えています。これを行う簡単な方法はありますか?

0 投票する
1 に答える
920 参照

android - モバイルデバイスの Django で動的 PDF を提供する方法

を使用しpdftkて、いくつかの動的な一時 PDF ファイルを生成し、Django がユーザーに提供します。

デスクトップでは正常に動作します-pdfファイルが開き、ユーザーは保存できますが、すべてのブラウザーのAndroid携帯で(iOSでも同じかもしれませんが、iOSデバイスがないためテストできません)、pdfは機能します正常にダウンロードされません。ダウンロードを開始しますが、その後常に失敗し、その理由がわかりません。

以下は、pdf バイナリ データを生成するビューと関数のスニペットです。

なぜこれが起こっているのかについてのアイデアはありますか?

0 投票する
1 に答える
3374 参照

vbscript - pdftkを使用して複数の場所にあるPDFをマージする

バッチまたはVBSスクリプトファイルから複数のPDFを呼び出すpdftkをマージしようとしています。問題は、PDFがすべて共通の親ディレクトリ内のサブフォルダにあることです。例:親フォルダー> subfolder1、subfolder2、subfolder3、ここで、script / BATファイルは親フォルダーにあり、各サブフォルダーにはPDFが含まれています。

pdftkは次のように呼び出されます:pdftk.exe * .pdf cat output OutputFile.pdf

これにより、現在のディレクトリにあるPDFのみがマージされ、サブフォルダにはマージされません。次のいずれかを行う方法はありますか?

  1. VBS / BATファイルを使用して、サブフォルダー内のすべてのPDFを別のディレクトリーにコピーし、一部のサブフォルダーが空の場合でもエラーアウトしないようにします。
  2. pdftkにサブフォルダーを調べて、マージするPDFを選択してもらいます

どんな助けでもいただければ幸いです。

0 投票する
4 に答える
62214 参照

php - PHP を使用して HTML フォーム データを PDF ファイルに変換する

私はこれを数日間調べてテストしており、誰かが私を別の方向に向けることができるかどうか疑問に思っていました. 非常に長い求人応募 HTML フォーム (jobapp.html) と一致する PDF (jobpdf.pdf) があり、HTML フォームと PDF の両方のすべてのエントリに同じフィールド名があります。フォームに入力されたユーザー データを取得して PDF に変換する必要があります。これは私がこれまでに集めたものですが、軌道に乗っているかどうかはわかりません:

pdftk は、これを達成するための唯一の実行可能なサードパーティ アプリですか?

pdftk を使用すると、ユーザー用に収集された $_POST データを取得して .fdf(user.fdf) を生成し、.pdf(job.pdf) で .fdf を平坦化します。フィールドが各ドキュメントのどこにあるかに関係なく、fdf の情報はフィールド名で pdf に入力されますか?

私はhttp://koivi.com/fill-pdf-form-fields/tutorial.php を試しています

「 HTMLフォームをPDFに送信する」も見ました

0 投票する
1 に答える
543 参照

php - PHPを使用してhtmlフォームからPDFに移動

重複の可能性:
PDF フォームへの PHP の入力

私はこれを数日間調べてテストしており、誰かが私を別の方向に向けることができるかどうか疑問に思っていました. 非常に長い求人応募 HTML フォーム (jobapp.html) と一致する PDF (jobpdf.pdf) があり、HTML フォームと PDF の両方のすべてのエントリに同じフィールド名があります。フォームに入力されたユーザー データを取得して PDF に変換する必要があります。これは私がこれまでに集めたものですが、軌道に乗っているかどうかはわかりません:

pdftk は、これを達成するための唯一の実行可能なサードパーティ アプリですか?

pdftk を使用すると、ユーザー用に収集された $_POST データを取得して .fdf(user.fdf) を生成し、.pdf(job.pdf) で .fdf を平坦化します。フィールドが各ドキュメントのどこにあるかに関係なく、fdf の情報はフィールド名で pdf に入力されますか?

0 投票する
0 に答える
478 参照

php - pdftk ユーティリティを使用した PHP exec() のセキュリティ

PHPスクリプトから呼び出してpdftk (pdftツールキット)を使用することに興味があります。exec()その機能を利用したいと考えています。コマンドは次の形式に従います。

pdftk [form_file] fill_form [data_file] output [output_file] flatten

このコマンドは、フォーム PDF ファイル ( form_file) を取得し、FDF データを挿入しdata_file、フォームをフラットにして として保存しoutput_fileます。

次のような関数を介してこのコマンドの実行を保護するために私が考えていることは次のとおりですexec()

  • ディレクトリ名とファイル名はユーザー定義ではありません。ディレクトリ名とファイル名は、サニタイズされた識別子文字列に基づいて生成され、英数字、ダッシュ、アンダースコア、およびピリオドのみが含まれます。識別子文字列は、制限された実用的な長さになります。
  • 引数 (ファイル名) はescapeshellarg()、コマンドに連結される前に渡されます (ただし、進行するステップに脆弱性がない場合、これはおそらく不要です)。
  • コマンド全体が渡されescapeshellcmd()ます。

このコマンドの実行に関して、セキュリティ上の脆弱性を見落としていませんか? (今考えられる唯一のことは、pdftk 自体に脆弱性があり、それがファイルを処理する方法であるかどうかです。) このプロセスを改善するための提案はありますか? ありがとう。

0 投票する
1 に答える
253 参照

cmd - 共有ファイル サーバーで pdftk を実行する

共有ファイル サーバーに pdftk をインストールしましたが、サーバー自体から正常に動作します。
ファイルサーバーにアクセスできるが、pdftk自体がインストールされていない別のコンピューターからpdftkを実行することは可能ですか?

どんな助けでも大歓迎です。

0 投票する
3 に答える
2048 参照

php - pdftkを使用したPHPでのバルクテンプレートベースのPDF生成

テンプレートに基づいてPDFファイルを大量に生成していますが、パフォーマンスの大きな問題がすぐに発生しました。私の現在のシナリオは次のとおりです。

  1. dbから入力するデータを取得します
  2. 単一のデータ行とPDFフォームに基づいてfdfを作成します
  3. .fdfファイルをディスクに書き込む
  4. pdftkを使用してpdfをfdfとマージします(flattenコマンドを使用したfill_form)
  5. .pdfすべてのが生成されるまで、行を繰り返し処理し続けます
  6. 生成されたすべてのファイルが最終的にマージされ、単一のpdfがクライアントに提供されます

passthruはクライアントに生の出力を提供するために使用します(ファイルの書き込み時間を節約します)が、これはパフォーマンスのほんの少しの改善です。総動作時間は200レコードで約50秒ですが、なんらかの形で少なくとも10秒に短縮したいと思います。

理想的なシナリオは、これらすべてのpdfをメモリ内で操作し、それらのすべてを個別のファイルに書き込まないことですが、そのようなデータをpdftkなどの外部ツールに渡すことができないため、出力を行うことは不可能です。もう1つのアイデアは、.fdfこれらすべての行を含む1つの大きなファイルを生成することでしたが、それは許可されていないようです。

私はここで非常に些細なことを見逃していますか?

アドバイスをありがとうございます。

PS。pdflibのような優れたライブラリを使用できることはわかっていますが、現在はオープンライセンスライブラリのみを検討しています。

編集:

テンプレートとして同じPDFを使用して複数のページでファイルを作成するための構文を理解しようとしてい.fdfますが、数時間かかり、適切なドキュメントが見つかりませんでした。

0 投票する
6 に答える
2641 参照

pdf - Ghostscriptスクリプトまたはその他、2つの複数ページのPDFファイルから奇数ページと偶数ページをインターリーブする

スキャナーに給紙がありますが、両面スキャンがありません。したがって、シートの両面に印刷されている複数ペ​​ージのドキュメントをスキャンすると、2つのpdfファイルが作成されます。1つはすべて奇数ページ(奇数ページpdfファイル)、もう1つはすべて偶数ページ(偶数ページのPDFファイル)。

偶数ページのpdfファイルの各ページが1ページおきに奇数ページのpdfファイルに追加されるように、2つのファイルをマージするGhostscriptスクリプトを作成できるはずだと思います。

誰かがそれを行う方法を知っていますか?

できれば、スクリプトは引数を取るので、最初の引数は出力ファイルを指定し、2番目の引数は奇数ページのpdfファイルを指定し、3番目の引数は偶数ページのpdfファイルを指定します。

0 投票する
2 に答える
2261 参照

python - 大きな .pdf を複数のファイルに分割しようとしています。(python、pdftk)

章/ブックマークごとに .pdf を分割するスクリプトを Python で作成しました。これが基本的に私のプログラムの核心です:

ツールキットはうまく機能しますが、何度も呼び出すのは明らかに時間効率の良い作業ではありません。200MB の .pdf ファイルの解析には 15 秒から 20 秒かかり、30 の個別の章にまたがると長い時間がかかります。実際にデータを書き込むよりも、ファイルを開くのに多くの時間が費やされます。

ツールキット内で複数のコマンドを文字列化する固有の方法がないように思われるため、これを回避できるようにする (つまり、.pdf を開いたままにする) Python または CMD でプルできるメモリのトリックはありますか? 別のモジュールも検討します (ただし、 pyPdfには独自の多くの問題があります)。