問題タブ [pdf]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
testing - 多数のPDFファイルを比較するためのツール?
光学コンテンツについては、多数のPDFファイルを比較する必要があります。PDFファイルはさまざまなプラットフォームで作成されており、ソフトウェアのバージョンも異なるため、構造上の違いがあります。例えば:
- テキストのチャンクは異なる場合があります
- 書き込み順序は異なる場合があります
- 位置はいくつかのピクセルで異なる場合があります
内部構造ではなく、人間のようにコンテンツを比較する必要があります。使用したPDFジェネレーターの異なるバージョン間の回帰をテストしたいと思います。
http - Acrobat でデフォルトの保存ファイル名を改善するための「名前」web pdf?
私のアプリは、ユーザーが使用するために PDF を生成します。「Content-Disposition」http ヘッダーは、ここで説明したように設定されます。これは「inline; filename=foo.pdf」に設定されています。これは、Acrobat が PDF を保存するときにファイル名として「foo.pdf」を指定するのに十分なはずです。
ただし、ブラウザに埋め込まれた Acrobat の [保存] ボタンをクリックすると、保存するデフォルトの名前はそのファイル名ではなく、スラッシュをアンダースコアに変更した URL になります。巨大で醜い。Adobe でこのデフォルトのファイル名に影響を与える方法はありますか?
URL にはクエリ文字列があり、これは交渉不可能です。これは重要かもしれませんが、URL の末尾に「&foo=/title.pdf」を追加しても、デフォルトのファイル名には影響しません。
更新 2: 両方を試しました
と
(Firebug で確認済み) 残念ながら、どちらも機能しませんでした。
サンプルURLは
これは、デフォルトの Acrobat の保存ファイル名に変換されます。
更新 3: Julian Reschke は、このケースに実際の洞察と厳密さをもたらします。彼の答えに賛成してください。これは FF ( https://bugzilla.mozilla.org/show_bug.cgi?id=433613 ) と IE では壊れているようですが、Opera、Safari、および Chrome では機能します。http://greenbytes.de/tech/tc2231/#inlwithasciifilenamepdf
c# - PDFページの並べ替え
毎月約 8000 個の PDF で実行する必要があるため、既に生成された PDF ファイルをプログラムで並べ替え、できるだけ少ないリソースを使用することは可能ですか?
現在、iTextSharp を使用して PDF をより大きな PDF にマージしていますが、iTextsharp のドキュメントにはあまり説明がありません。
perl - Perl に最適な XSLT エンジンは何ですか?
多くの XSLT エンジンのうち、Perl でうまく動作するものを知りたいです。
Apache (2.0) と Perl を使用し、PDF と XHTML を入手したいと考えています。
この種のプロジェクトは初めてなので、コメントや提案は大歓迎です。
ありがとう。
Google で簡単な検索を行ったところ、たくさん見つかりましたが、もっとたくさんあると思います。
- http://www.mod-xslt2.com/
- http://xml.apache.org/xalan-j/
- http://saxon.sourceforge.net/
- http://www.dopscripts.com/xslt_parser.html
あなたの経験についてのコメントは大歓迎です。
pdf - PDF ファイル内のスキャンからプログラムでテキストを認識
データベースにインポートする必要があるデータを含む PDF ファイルがあります。ファイルは、印刷された英数字テキストの pdf スキャンのようです。10ptのようです。タイムズニューローマン。
このテキストを認識して解析できるツールやコンポーネントはありますか?
asp.net - ASP.NET で MS Word ドキュメントを PDF に変換する
同様の質問がされていますが、私のものとまったく同じものはありません。
ASP.NET Web サーバー上に Microsoft Word ドキュメントのコレクションがあり、ユーザー フォームの送信の結果として値が入力される差し込みフィールドがあります。フィールド マージの後、サーバーはドキュメントを PDF に変換し、それをブラウザーにストリーミングする必要があります。私たちの最初の傾向は、Visual Studio Tools for Office API を使用することでした。ただし、Microsoft から次の警告が表示されます。
Office が不安定な動作を示したり、/または、この環境で Office を実行するとデッドロックが発生します。
フィールド操作はOpen XML SDKを使用して実行できるようですが、Word を開かずに Word 2007 文書を PDF に変換する最良の方法は何ですか? 最適なソリューションは、低コストでスケーラブルで、メモリ フットプリントが小さく、展開が容易で、.NET API を備えているものです。
vb.net - プログラムでPDFプリンターに印刷する
VisualBasic2008で既存のファイルをプログラムでPDFに印刷しようとしています。
現在関連するアセットは次のとおりです。VisualStudio2008Professional Adobe Acrobat Professional 8.0
ITextSharpのようなSDKを入手することを考えましたが、Adobeのフルバージョンがあるので、特に私がやろうとしていることにはやり過ぎのようです。
PDFプリンターに印刷する(そしてもちろん特定の場所に印刷するように割り当てる)比較的単純なコードがありますか、それともPDFに印刷するために別のライブラリを使用する必要がありますか?
以前に作成したドキュメントをPDFファイルに印刷したい。この場合、.pdfファイルにしたいのは.snpファイルですが、ロジックはどのファイルタイプでも同じだと思います。
上記のシェル実行を試しましたが、希望どおりに実行されません。印刷したい場所(複数の場所)が印刷されないので、同じ名前のPDFファイルを多数作成するので重要です(PDF内に異なるデータがあり、対応するクライアントフォルダ)
現在のプロセスは次のとおりです。
- \\ report server\client1に移動します
- フォルダ内のすべてのsnpドキュメントのPDFファイルを手動で作成します
- PDFを\\websitereports\client1にコピーします
- その後、100以上のクライアントすべてに対して繰り返し、完了して確認するのに約2時間かかります
私はこれがもっとうまくいくことができることを知っていますが、私はここにたった3か月しかいませんでした、そしてもっともっと差し迫った他の差し迫った懸念がありました。また、これほど些細なことのようにコーディングするのが難しいとは思っていませんでした。
pdf - iText API を使用して PDF ファイル内のすべてのブックマークの宛先を作成する
PDFドキュメントを取得し、すべてのブックマークから名前付きの宛先を作成する(Java)コードを書きたいと思います。iText API はこれを行う最も簡単な方法だと思いますが、API を使用したことはありません。
この種のコードを iText API でどのように記述しますか? iText は、既存の PDF を単独で操作するために必要な解析を行うことができますか? 私が考えている操作の種類は次のとおりです。
- 開ける、
- ブックマークを見つけて、
- 目的地を作成し、
- 保存、
- 近い。
それとも、より良い別の API がありますか?
php - Zend Framework を使用して utf-8 マルチバイト文字を含む PDF ファイルを生成する方法
Zend Framework Zend_Pdf クラスに「小さな」問題があります。マルチバイト文字は、生成された pdf ファイルから削除されます。たとえば、aąbcčdeę と書くと、リトアニア文字が取り除かれた abcd になります。
それが特に Zend_Pdf の問題なのか、一般的な php の問題なのかはわかりません。
ソース テキストは utf-8 でエンコードされ、ジョブを実行する php ソース ファイルも同様です。
よろしくお願いします。
PS Zend Framework v. 1.6 を実行し、FONT_TIMES_BOLD フォントを使用しています。FONT_TIMES_ROMAN は動作します
.net - ときどき ABCpdf がメモリ不足になる
私が取り組んでいるプロジェクトでは、サードパーティ コンポーネントを使用して、ABCpdf.Net という VB.Net Web システムで動的 PDF を構築しています。(ひどいツールではありませんが、優れたツールでもありません。)
ときどき、理由はわかりませんが、ドキュメント オブジェクトは SEHException をスローします。さらに調べてみると、これは WebSupergoo.ABCpdf6.Internal.PDFException 型のドキュメント オブジェクトのカスタム例外が原因であることが判明しました。内容には、あまり役に立たないタイトル「画像データを取得できません。メモリ不足です」のみが含まれています。通常、これは PDF に画像を追加しようとしたときに発生します。これらの画像は 100k 未満の PNG であるため、サイズは問題ではないと思います。
また、本当に奇妙なことは、この問題が発生し始めると、それを止める唯一の方法は Web サーバーを再起動することであるということです。これは明らかに標準以下です。
誰かがこの問題を経験したことがありますか (またはこのツールを使用したことがありますか?)