ios - CGPDFScanner、Identity-H、解凍

Question

私のインスタンスはCGPDFScanner、テストpdfファイルをスキャンしています。

ある時点で、現在のフォントディクショナリにはEncodingvalueとkeyIdentity-Hを持つディクショナリがあります。このキーはたまたまストリーム値用であり、その辞書にはキーがあります。このキーの値はです。FontDescriptorFontFile2FilterFlateDecode

これを解釈して使用する方法がわかりません (たとえば、次のTjブロックのテキストを Unicode に抽出するため)。たとえば、次のTjブロックのバイトを zlib 解凍するだけですか? （ToUnicodeここに鍵はありません。）

すべての解凍はのインスタンスによって実行されると思っていましたCGPDFScanner。

score 0 · Accepted Answer

フォントが Identity-H エンコーディングを使用していて、ToUnicode エントリがない場合、テキストを抽出できません。Tj 演算子のパラメーターはグリフインデックスのシーケンスであり、このシーケンスは ToUnicode エントリがないとテキストに変換できません。

FontFile2 エントリには、実際のフォントファイルが格納されます。PDF ファイルからテキストを抽出する際には何の役割も果たしません。

ios - CGPDFScanner、Identity-H、解凍

1 に答える 1

Related

Reference