ios - PDF のスキャン中に CGPDFStringGetBytePtr が正しくない文字列を返す

Question

PDF が 1 つあり、CGPDFScanner を使用して PDF をスキャンしようとしています。PDF のスキャン中に「ファイル」という単語が検出されると、CGPDFStringGetBytePtr API は「\x02le」を返します。PDF には Type1 フォントがあり、ToUnicodeMapping(CMap) はありません。エンコーディングディクショナリが PDF に存在しないため、NSUTF8String エンコーディングを使用します。ただし、すべての NSMacOSRomanStringEncoding、NSASCIIStringEncoding を試しましたが、うまくいきませんでした。何が問題になる可能性がありますか?

ありがとう。

score 2 · Accepted Answer

コード \x02 は 'fi' 文字列に対応します。'fi' シーケンスは合字を使用して描画されるため、文字コードは 1 つしかありません。
コードと文字列の対応は、フォントエンコーディングで行われます。フォントエンコーディングには、コード \x02 とシーケンス 'fi' の間のマッピングを指定する /Differences 配列が含まれています

ios - PDF のスキャン中に CGPDFStringGetBytePtr が正しくない文字列を返す

1 に答える 1

Related

Reference