2

PDF が 1 つあり、CGPDFScanner を使用して PDF をスキャンしようとしています。PDF のスキャン中に「ファイル」という単語が検出されると、CGPDFStringGetBytePtr API は「\x02le」を返します。PDF には Type1 フォントがあり、ToUnicodeMapping(CMap) はありません。エンコーディング ディクショナリが PDF に存在しないため、NSUTF8String エンコーディングを使用します。ただし、すべての NSMacOSRomanStringEncoding、NSASCIIStringEncoding を試しましたが、うまくいきませんでした。何が問題になる可能性がありますか?

ありがとう。

4

1 に答える 1

2

コード \x02 は 'fi' 文字列に対応します。'fi' シーケンスは合字を使用して描画されるため、文字コードは 1 つしかありません。
コードと文字列の対応は、フォント エンコーディングで行われます。フォント エンコーディングには、コード \x02 とシーケンス 'fi' の間のマッピングを指定する /Differences 配列が含まれています

于 2015-05-08T14:23:40.983 に答える