c# - フォントが埋め込まれた PDF からテキスト/データを抽出する方法

翻译自：https://stackoverflow.com/questions/15544946 2013-03-21T10:28:46.497

1673 次

私は PDF を持っています。インド語 (カンナダ語) が使用されていますが、PDF からテキストをコピーしてメモ帳に貼り付けると、コンテンツが四角いボックスとして表示されます。iTextSharp を使用してプログラムで読み込もうとしましたが、うまくいきませんでした。プロパティを確認したところ、サブセット付きの埋め込みフォント (Arial Unicode MS(True Type) - IDENTITY-H) と表示されています。

そこからテキストを抽出する方法を知っている人はいますか? どんな助けでも大歓迎です。

c# - フォントが埋め込まれた PDF からテキスト/データを抽出する方法

0 に答える 0

Related

Reference