問題タブ [pdftk]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
excel - pdfTk で作成した pdf の複数の埋め込みフォントを削除する
PDF ファイルから複数回埋め込まれたフォントを削除する方法はありますか?
これは私のシナリオです:
1) プログラムは、複数の 1 ページの PDF レポートを生成します (DB にクエリを実行し、Excel テンプレートに情報を配置し、フォーマットされた情報を PDF にエクスポートします)。
2) pdftk は、単一ページの PDF を 1 つのファイルにマージします。
すべて正常に動作しますが、結果の pdf のサイズが非常に大きくなります。実際、フォントが複数回埋め込まれていることに気付きました (ページ数と同じ回数: すべてのページは同じ Excel テンプレートから開始して生成されます)。フォントは単一の pdf ファイルに埋め込まれ、pdftk は pdf を接着するだけです)。各埋め込みフォントのコピーを 1 つだけ保持する方法はありますか?
Excel->pdf からエクスポートしているときに、最初のページだけにフォントを埋め込もうとしました。ファイルのサイズは劇的に減少しますが、他のページは埋め込まれたフォントにアクセスできないようです。
ありがとう、アレッサンドロ
ruby-on-rails - pdftkユニコード変換結果からのruby1.8.7での文字変換
pdftkを使用してpdfファイルからタイトルを解析しています。さまざまな言語固有の文字が含まれています。
私がこれを行う必要があるこのrubyonrailsアプリケーションは、ruby1.8.7とrails2.3.14を使用しているため、ruby1.9に組み込まれているエンコーディングソリューションは現在のところオプションではありません。
私がする必要があることの例:
タイトルにüが含まれている場合、pdftk(コマンドラインまたはruby pdf-toolkit gemのいずれか)を使用してpdfコンテンツを読み取ると、「ü」は次のように変換されます。ü
私のアプリケーションでは、これがWebページやXMLファイルでのニーズにうまく機能しているように見えるので、これが本当に必要です。
ルビーで明示的に文字を変換することができます
しかし、明らかに私はこれを一つずつやりたくありません。
Iconvを使用してこれを実行しようとしましたが、これをレンダリングされた文字に変換するために何を指定すればよいかわからないと感じています。たぶんこれはutf-8だと思いましたが、レンダリングされた文字に変換されていないようです
レンダリングされた文字の最終結果を取得するために、ここでどの形式を使用するか、またはどの形式を使用するかについて、私は少し混乱しています。
では、Iconvまたは他のツールを使用して、pdftkからこのHTMLコードに変換されたすべての文字に対してこの変換を行うにはどうすればよいでしょうか。
または、最初にpdfファイルを読んだときにこれを行うようにpdftkに指示する方法!
forms - pdftkで入力した後、pdfフォームを編集可能に保ちます
pdftk を使用してフォームに入力していますが、出力フォームを編集できません。アクロバット リーダーで開くと、次のエラー メッセージが表示されます。が作成され、拡張機能は使用できなくなりました。」
ドキュメントを編集可能にしておくことは可能ですか?
pdf - PDFコメントセキュリティをリセットするためのpdftkおよびqpdf
LinuxでPDFファイルに注釈を追加できるようにするには、PDFドキュメントの「コメント」セキュリティ設定をリセットする必要があります。
qpdf --decrypt input.pdf output.pdf
パスワードまたは「暗号化」を削除する必要があります(この投稿によると)
pdftk input input.pdf output output.pdf allow AllFeatures
すべてのドキュメント セキュリティ (「コメント」を含む) を許可するように設定する必要があります。
両方のコマンドを適用した後、acroread で (ファイル -> ドキュメント -> セキュリティ タブ) コメントが許可されていないことがわかります。
このセキュリティ プロパティをリセットするにはどうすればよいですか?
php - PHP強制PDFダウンロードがAndroidのブラウザでのみ機能しない
POSTリクエストを使用して、ダウンロード可能なドキュメントをその場で作成するために必要なデータを転送します。
フォームが送信されると、$ _ POST配列は、作成されたFDFファイルのパスを返す関数に渡されます。
コード:
すべてのブラウザ(Safari、Firefox、Opera、Chrome、Internet Explorer)で動作しますが、Androidストックブラウザでは動作しません。
Androidブラウザーでは、ダウンロードは実行されますが、ファイルのコンテンツが空であるかHTMLのゴミであるか、ブラウザーがファイルをダウンロードしているが、ファイル名を無視して、ファイルを生成したスクリプトの名前でファイルを保存しようとしています。
どんな助けでも大歓迎です。
ありがとう!
アップデート!!!
解決策: http: //digiblog.de/2011/04/19/android-and-the-download-file-headers/
linux - 明らかに破損したPDFを修復し、ファイルサイズを縮小する
pdftk
Ubuntu 12.04を使用して、6 つの異なる PDF (テキストとビットマップ グラフィックの両方を含む) を組み合わせて作成した PDF ファイル (4.6MB) があります。品質に影響を与えずに、このファイルを 2MB 近くまで圧縮したいと考えています。
私はpdftkの「圧縮」オプションを試しました(2 MBに圧縮できませんでした)。また、最初にpsに変換してからpdfに戻すことも試みましたが、次の警告が表示されます。
****警告: '0000000000 XXXXX n' はフリー エントリと見なされます。
そしてハングします。qpdf
ファイルが破損していると言って失敗しました。
誰か助けてくれませんか?
php - PDFTK の場所 (500 内部エラー)
だから私はPDFTKをインストールしており、ルートディレクトリ内で動作しているようです。(IE: /public_html/) しかし、スクリプトを「フォルダ」(IE: /public_html/test/) に移動するとすぐに、500 内部サーバー エラーが発生します。
これは私が持っていて、テストしたコードです。
これらのオプションはすべて同じ ERROR (500) を返すようです。奇妙な部分は、サイトのルート内で実行すると正常に動作することです。
どんな助けでも大歓迎です。
node.js - pdftk を介して複数ページの PDF を個々のページに繰り返しバーストすると、それらのページの md5 チェックサムが変更されるのはなぜですか?
私はpdftkを使用しており、いくつかのテストを行っており、複数ページのPDFファイルを個別の単一ページのPDFファイルにバーストし、それらの単一ページのPDFごとにmd5ハッシュチェックサム(デジタル指紋)を生成すると、毎回異なるハッシュになりますバーストを行います。これは、変更のないまったく同じファイルであっても結果です。
私のテストプロセスは次のとおりです。
- test.pdf (10 ページを含む単純なテキストのみの PDF) を解凍します。
- pdftk を使用して、test.pdf を 10 個の個別の PDF ファイル (ファイルごとに 1 ページ) にバースト (分割) します。
- 10 個の単一ページ PDF ファイルごとに md5 ハッシュ チェックサムを生成する
- 10 個のハッシュ チェックサムを記録する
- 手順 1 ~ 4 を繰り返します
- すべてのハッシュが異なることに注意してください
補足:解凍後にPDFでチェックサムを生成すると、繰り返してもまったく同じチェックサムが得られます。
この演習では、 node.jsとその暗号モジュールを使用しています。
私の質問は、繰り返しによってチェックサムが異なるのはなぜですか? 結果として得られる 10 個の単一ページ ファイルは、最後に作成されたときとまったく同じであると思います。親ドキュメント (および個々のページ自体) はまったく変更されていません。
php - 共有 Web サーバーへの PDFTK のインストール
私の Web サイトは、ある種の Linux (正確な種類はわかりません) と Apache を使用して、Total Choice Hosting でホストされています。コマンドラインへのアクセス権がありません。コマンドライン プログラムは、PHP の exec() または CRON ジョブを介してのみ実行できます。
このようなシステムに PDFTK をインストールして使用できますか?
もしそうなら、私は正確に何をしなければなりませんか?どのファイルをどこにコピーする必要がありますか? ソースから PDFTK を再構築する必要がありますか、それとも実行可能なバージョンがどこかにありますか?
(私が理解しているように)PDFTKはJavaで書かれたiTextに基づいているためです。元の iText パッケージを使用したほうがよいでしょうか?
または、私がやりたいことを行うためのより良い方法はありますか (基本的には、PDF ファイル (空白のフォーム) を FDF ファイル (フィールド値) とマージして平坦化し、新しい PDF ファイル (完成したフォーム) にダウンロードします)ユーザー)?これを行うためのネイティブ PHP、Python、または Perl コードはありますか?
ありがとう - ローワン
php - pdftk + xfdf + php はウムラウトを処理できません
XFDF ファイルを使用して PHP と pdftk で PDF フォーム サーバーサイドに入力していますが、フォーム フィールドに英語以外の文字 (ä、ö、å など) が出力されないという問題があります。
XFDF ファイルの解析に使用する関数は次のとおりです。
結果の XFDF ファイルは次のようになります。
英語の文字を含むフィールドは完全に印刷されますが、アキュート、グレイブ、またはスカンジナビアの追加を含む文字は PDF ファイルに転送されません。 何らかの理由を除いて
完全に動作し、öä! を出力します。
私が実行するコマンドは
これにより、エラーは発生しません。
Debian 6.0、PHP 5.3.3-7+squeeze13 を使用しており、pdftk のバージョンは 1.44-5 です。
更新生成されたファイルをフラット化して開かないと、フィールドがアクティブになっているときに文字が正しく印刷されますが、フィールドがフォーカスされていないときに再び非表示になることに気付きました。ファイルに手動で何かを入力すると、特殊文字も表示されます。ただし、保存して再度開いたファイルには、テキストが再度追加されない限り、テキストは表示されません。
更新 2いまいましい問題を修正しました。もともと、フォームは OSX Snow Leopard 上の Adobe Acrobat Pro で作成されていました。今、LibreOffice + Oracle PDF Import プラグインを使用してフォームを作り直しましたが、すべてが機能しているようです!