1

特定の基準で PDF を検証する必要があるケーススタディに取り組みます (たとえば、PDF のコンテンツが特定のフォント、フォント サイズ、ロゴの位置であるかどうかを確認します)。iTEXT を使用して、この種の PDF 仕様を取得できるかどうかを確認したいだけですか? はいの場合、それを行うために iTEXT で使用される API は何ですか?

注: この種の機能を実行するツールは市場に他にありますか?

4

1 に答える 1

2

iText を使用すると、すべての PDF オブジェクト (辞書、配列、ストリームなど) に直接アクセスできるため、必要なツールが提供されます。しかし、あなたの仕事を過小評価しないでください。確認する基準によっては、かなり多くの作業が必要になる場合があります。

たとえば、すべてのテキストが 1 つの特定のフォントを使用する必要があるという基準が含まれている場合は、ドキュメントのテキスト全体を単純に解析してフォントを確認できます。一方、見出しと標準テキストなどを区別する必要がある場合は、通常、ヘッダーはヘッダーとしてマークされないため、ヒューリスティックを導入する必要があります。

あなたの小切手はどれくらい良いものでなければなりませんか?フォント ディクショナリに必要な名前のエントリがある場合、それで十分ですか、それともフォント (おそらく埋め込みフォント サブセット) が実際に必要なフォントであることを実際に確認する必要がありますか?

ロゴの位置について言及しています。ロゴをどのように認識しますか (他の図や画像と比較して)?

...

したがって、iText をベースとして使用できますが、事前にかなり多くのことを考える必要があります。iText を真剣に使用することに決めた場合は、iText in Action — 2nd Editionを参照することをお勧めします。

他の PDF ライブラリとツールもあり、無料 (フリー ビールまたはフリー スピーチのいずれか) と商用の両方で、PDF 分析のフレームワークを提供します。私は主に iText を使用しているため、他のものについて詳しく知りません。

PDF 仕様ISO 32000-1:2008 (特に、グラフィックスとテキストに関する第 8 章と第 9 章) を確認して、PDF に含まれるものと含まれないものを把握する必要があります。

于 2012-12-26T16:27:13.173 に答える