3

この質問はすでに数回前に行われたことは知っていますが、これを明確にしたいと思います。私はPDFリーダーを持っていて、それにハイライト機能を追加したいと思います。TjandTJ演算子を解析することで、すでにテキストを抽出できます。今、私はpdfでテキストの場所を見つけたいです。

最初に私は値を見つけようとしましたTm。の(x、y)を抽出できましたが、Tm正しくないようです。だから私はとに行くことにしましTdTD。問題は、演算子のコールバックが呼び出されないため、PDFにTdまたは値が含まれていないように見えることです。TD(コールバックが呼び出されているかどうかを確認するために、コールバックにログを入れましたが、表示されませんでした。)

だから私の質問は、PDF内のテキストの位置を見つけたいかどうかです。どちらを調べますか?値TmまたはTd/TD値?それとも両方ですか?

追加の質問:

Tmには6つのパラメータがあります:a, b, c, d, ef。私はそれを知ってeおり、とをf表しますが、他の4つのパラメーターは何を表しますか?txty

4

1 に答える 1

3

すべてのテキスト演算子を処理する必要があります。また、それらの一部がどのように機能するかを知る必要があります。たとえば、垂直書き込みフォントは、W2エントリを適用して、グリフを描画する前に、水平グリフの原点を垂直グリフの原点に移動します。

Tm、TD、およびTdに加えて、T *を処理する必要があります。また、TJおよびTjに加えて、'および"を処理する必要があります。単一の'show'操作内でテキストがどのように配置されるかを知りたい場合は、次のことも考慮する必要があります。 Tc、Tw、Tz、TL、およびTsの値。

また、現在の変換行列を処理する必要がある場合もあります。

于 2012-06-25T12:26:27.617 に答える