中国語のPDF形式のテキストを検索したい。CGPDFScannerを使用しています。CIDFontType2で正しいテキストを取得できません。
フォントオブジェクトにToUnicode
エントリがあります
fontNameはHFKAAO+LinGothic-太字
名前IDのエントリがありCIDToGIDMap
ます(PDFドキュメントによるとTrueTypeフォントプログラムが埋め込まれていることを意味します)
CIDSystemInfo
レジストリはアドビです
注文はアイデンティティです
FlateDecodeを使用したFontDescriptorFilterにFontFile2エントリがあります
Tjから取得したテキストを膨らませただけなのに、うまくいかないという人がいます... zlibを使用してテキストを膨らませましたが、正しいデータが生成されていないようです。
勉強できるサンプルコードはありますか?
https://github.com/KurtCode/PDFKittenを見つけましたが、中国語では機能しません。