私は PDF を持っています。インド語 (カンナダ語) が使用されていますが、PDF からテキストをコピーしてメモ帳に貼り付けると、コンテンツが四角いボックスとして表示されます。iTextSharp を使用してプログラムで読み込もうとしましたが、うまくいきませんでした。プロパティを確認したところ、サブセット付きの埋め込みフォント (Arial Unicode MS(True Type) - IDENTITY-H) と表示されています。
そこからテキストを抽出する方法を知っている人はいますか? どんな助けでも大歓迎です。