PDF ファイルを txt に変換する C# または C++ (MFC) アプリケーションを作成する必要があります。変換するだけでなく、ヘッダー、フッター、左余白のゴミ文字などを削除する必要があります。したがって、アプリケーションでは、ユーザーがページ余白を設定して不要なものを切り取ることができます。実際に xpdf を使用してそのようなアプリケーションを作成しましたが、抽出したテキストにカスタム タグを挿入して斜体と太字を維持しようとすると、いくつかの問題が発生します。多分誰かが何か役に立つことを提案できますか?
ありがとう。