私は、当社の PDF リーダー アプリを作成する任務を負っています。いくつかの調査の後、PDF 内のさまざまな演算子と混同されました。ここに私が明確にしたいことがいくつかあります:
- 演算子は、
Tm
各行の開始点として使用されます。(私の理解は正しいですか?) 演算子がすべての行の開始点である場合、指定された範囲内でのみ
Tm
表示されるテキストを解析するにはどうすればよいですか? 例えば:Tm
BT 0 0 1 rg /Ti 12 Tf 1 0 0 1 100 100 Tm 0 0 Td (The quick brown fox ) Tj 0 −13 Td (ate the lazy mouse.) Tj ET //I only want to get the Tj and TJ string being positioned by the Tm
グリフの高さと幅の 1000 単位ごとに、テキスト スペースの 1 単位に相当することを理解しています。では、グリフの幅が 2000 で高さが 1060 の場合、「実際の」幅と高さはそれぞれ 2 と 1.06 ということですか?
これらの質問のいくつかがまったくばかげているように聞こえることはわかっていますが、調査する時間はあまりありません. 誰かが私がこれを理解するのを手伝ってくれるなら、それは間違いなく感謝されます.
注: PDF リーダー アプリには、検索とハイライト機能、テキスト選択、メモ、ブックマークなどを含める必要があります。現在利用可能なほぼすべてのリーダーで見つけることができる基本的なものは事実上すべてです。おそらくサードパーティ製のライブラリを使用して作業を楽にしようと思いますが、最大の問題はテキスト選択機能です。だから私は本当にこれを理解する必要があります。