中国語のPDF形式のテキストを検索したい。CGPDFScannerを使用しています。CIDFontType2で正しいテキストを取得できません。
フォントオブジェクトにToUnicodeエントリがあります
fontNameはHFKAAO+LinGothic-太字
名前IDのエントリがありCIDToGIDMapます(PDFドキュメントによるとTrueTypeフォントプログラムが埋め込まれていることを意味します)
CIDSystemInfo
レジストリはアドビです
注文はアイデンティティです
FlateDecodeを使用したFontDescriptorFilterにFontFile2エントリがあります
Tjから取得したテキストを膨らませただけなのに、うまくいかないという人がいます... zlibを使用してテキストを膨らませましたが、正しいデータが生成されていないようです。
勉強できるサンプルコードはありますか?
https://github.com/KurtCode/PDFKittenを見つけましたが、中国語では機能しません。