1

CGPDFScannerPDFからテキストを抽出するために使用しています。

オペレーターのコールバックが呼び出された時点TJで、現在のフォントのCIDSystemInfo->Registry値は「Adobe」とCIDSystemInfo->Ordering「Japan1」です。つまり、文字セット「Adobe-Japan1」。

Tjこのファクトを使用して、演算子で見つけたすべてのテキストをユニコードに変換するにはどうすればよいですか?

私はここの木のために木を見ていないと確信しています。

4

1 に答える 1

0

Adobe の CMAP ファイルを使用して、Japan1 を Unicode に再マップできます。正しいファイルを取得するには、「補足」も参照してください。

http://opensource.adobe.com/wiki/display/cmap/Downloads

于 2011-08-11T23:08:40.147 に答える