問題タブ [pdf]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
10 に答える
96396 参照

testing - 多数のPDFファイルを比較するためのツール?

光学コンテンツについては、多数のPDFファイルを比較する必要があります。PDFファイルはさまざまなプラットフォームで作成されており、ソフトウェアのバージョンも異なるため、構造上の違いがあります。例えば:

  • テキストのチャンクは異なる場合があります
  • 書き込み順序は異なる場合があります
  • 位置はいくつかのピクセルで異なる場合があります

内部構造ではなく、人間のようにコンテンツを比較する必要があります。使用したPDFジェネレーターの異なるバージョン間の回帰をテストしたいと思います。

0 投票する
16 に答える
40111 参照

http - Acrobat でデフォルトの保存ファイル名を改善するための「名前」web pdf?

私のアプリは、ユーザーが使用するために PDF を生成します。「Content-Disposition」http ヘッダーは、ここで説明したように設定されます。これは「inline; filename=foo.pdf」に設定されています。これは、Acrobat が PDF を保存するときにファイル名として「foo.pdf」を指定するのに十分なはずです。

ただし、ブラウザに埋め込まれた Acrobat の [保存] ボタンをクリックすると、保存するデフォルトの名前はそのファイル名ではなく、スラッシュをアンダースコアに変更した URL になります。巨大で醜い。Adobe でこのデフォルトのファイル名に影響を与える方法はありますか?

URL にはクエリ文字列があり、これは交渉不可能です。これは重要かもしれませんが、URL の末尾に「&foo=/title.pdf」を追加しても、デフォルトのファイル名には影響しません。

更新 2: 両方を試しました

(Firebug で確認済み) 残念ながら、どちらも機能しませんでした。

サンプルURLは

これは、デフォルトの Acrobat の保存ファイル名に変換されます。

更新 3: Julian Reschke は、このケースに実際の洞察と厳密さをもたらします。彼の答えに賛成してください。これは FF ( https://bugzilla.mozilla.org/show_bug.cgi?id=433613 ) と IE では壊れているようですが、Opera、Safari、および Chrome では機能します。http://greenbytes.de/tech/tc2231/#inlwithasciifilenamepdf

0 投票する
2 に答える
2700 参照

c# - PDFページの並べ替え

毎月約 8000 個の PDF で実行する必要があるため、既に生成された PDF ファイルをプログラムで並べ替え、できるだけ少ないリソースを使用することは可能ですか?

現在、iTextSharp を使用して PDF をより大きな PDF にマージしていますが、iTextsharp のドキュメントにはあまり説明がありません。

0 投票する
5 に答える
8013 参照

perl - Perl に最適な XSLT エンジンは何ですか?

多くの XSLT エンジンのうち、Perl でうまく動作するものを知りたいです。

Apache (2.0) と Perl を使用し、PDF と XHTML を入手したいと考えています。

この種のプロジェクトは初めてなので、コメントや提案は大歓迎です。

ありがとう。


Google で簡単な検索を行ったところ、たくさん見つかりましたが、もっとたくさんあると思います。

あなたの経験についてのコメントは大歓迎です。

0 投票する
10 に答える
59441 参照

pdf - PDF ファイル内のスキャンからプログラムでテキストを認識

データベースにインポートする必要があるデータを含む PDF ファイルがあります。ファイルは、印刷された英数字テキストの pdf スキャンのようです。10ptのようです。タイムズニューローマン。

このテキストを認識して解析できるツールやコンポーネントはありますか?

0 投票する
8 に答える
51304 参照

asp.net - ASP.NET で MS Word ドキュメントを PDF に変換する

同様の質問がされていますが、私のものとまったく同じものはありません。

ASP.NET Web サーバー上に Microsoft Word ドキュメントのコレクションがあり、ユーザー フォームの送信の結果として値が入力される差し込みフィールドがあります。フィールド マージの後、サーバーはドキュメントを PDF に変換し、それをブラウザーにストリーミングする必要があります。私たちの最初の傾向は、Visual Studio Tools for Office API を使用することでした。ただし、Microsoft から次の警告が表示されます

Office が不安定な動作を示したり、/または、この環境で Office を実行するとデッドロックが発生します。

フィールド操作はOpen XML SDKを使用して実行できるようですが、Word を開かずに Word 2007 文書を PDF に変換する最良の方法は何ですか? 最適なソリューションは、低コストでスケーラブルで、メモリ フットプリントが小さく、展開が容易で、.NET API を備えているものです。

0 投票する
10 に答える
37933 参照

vb.net - プログラムでPDFプリンターに印刷する

VisualBasic2008で既存のファイルをプログラムでPDFに印刷しようとしています。

現在関連するアセットは次のとおりです。VisualStudio2008Professional Adob​​e Acrobat Professional 8.0

ITextSharpのようなSDKを入手することを考えましたが、Adobeのフルバージョンがあるので、特に私がやろうとしていることにはやり過ぎのようです。

PDFプリンターに印刷する(そしてもちろん特定の場所に印刷するように割り当てる)比較的単純なコードがありますか、それともPDFに印刷するために別のライブラリを使用する必要がありますか?


以前に作成したドキュメントをPDFファイルに印刷したい。この場合、.pdfファイルにしたいのは.snpファイルですが、ロジックはどのファイルタイプでも同じだと思います。


上記のシェル実行を試しましたが、希望どおりに実行されません。印刷したい場所(複数の場所)が印刷されないので、同じ名前のPDFファイルを多数作成するので重要です(PDF内に異なるデータがあり、対応するクライアントフォルダ)


現在のプロセスは次のとおりです。

  • \\ report server\client1に移動します
  • フォルダ内のすべてのsnpドキュメントのPDFファイルを手動で作成します
  • PDFを\\websitereports\client1にコピーします
  • その後、100以上のクライアントすべてに対して繰り返し、完了して確認するのに約2時間かかります

私はこれがもっとうまくいくことができることを知っていますが、私はここにたった3か月しかいませんでした、そしてもっともっと差し迫った他の差し迫った懸念がありました。また、これほど些細なことのようにコーディングするのが難しいとは思っていませんでした。

0 投票する
2 に答える
5814 参照

pdf - iText API を使用して PDF ファイル内のすべてのブックマークの宛先を作成する

PDFドキュメントを取得し、すべてのブックマークから名前付きの宛先を作成する(Java)コードを書きたいと思います。iText API はこれを行う最も簡単な方法だと思いますが、API を使用したことはありません。

この種のコードを iText API でどのように記述しますか? iText は、既存の PDF を単独で操作するために必要な解析を行うことができますか? 私が考えている操作の種類は次のとおりです。

  • 開ける、
  • ブックマークを見つけて、
  • 目的地を作成し、
  • 保存、
  • 近い。

それとも、より良い別の API がありますか?

0 投票する
4 に答える
14161 参照

php - Zend Framework を使用して utf-8 マルチバイト文字を含む PDF ファイルを生成する方法

Zend Framework Zend_Pdf クラスに「小さな」問題があります。マルチバイト文字は、生成された pdf ファイルから削除されます。たとえば、aąbcčdeę と書くと、リトアニア文字が取り除かれた abcd になります。

それが特に Zend_Pdf の問題なのか、一般的な php の問題なのかはわかりません。

ソース テキストは utf-8 でエンコードされ、ジョブを実行する php ソース ファイルも同様です。

よろしくお願いします。

PS Zend Framework v. 1.6 を実行し、FONT_TIMES_BOLD フォントを使用しています。FONT_TIMES_ROMAN は動作します

0 投票する
3 に答える
9828 参照

.net - ときどき ABCpdf がメモリ不足になる

私が取り組んでいるプロジェクトでは、サードパーティ コンポーネントを使用して、ABCpdf.Net という VB.Net Web システムで動的 PDF を構築しています。(ひどいツールではありませんが、優れたツールでもありません。)

ときどき、理由はわかりませんが、ドキュメント オブジェクトは SEHException をスローします。さらに調べてみると、これは WebSupergoo.ABCpdf6.Internal.PDFException 型のドキュメント オブジェクトのカスタム例外が原因であることが判明しました。内容には、あまり役に立たないタイトル「画像データを取得できません。メモリ不足です」のみが含まれています。通常、これは PDF に画像を追加しようとしたときに発生します。これらの画像は 100k 未満の PNG であるため、サイズは問題ではないと思います。

また、本当に奇妙なことは、この問題が発生し始めると、それを止める唯一の方法は Web サーバーを再起動することであるということです。これは明らかに標準以下です。

誰かがこの問題を経験したことがありますか (またはこのツールを使用したことがありますか?)