最近、VB2010 アプリで iTextSharp を使用して、PDF ドキュメントからテキスト データを解析する実験を行っています。ドキュメントには、画像やその他の装飾的な要素は含まれず、テキストのみが含まれます。私はいくつかの記事を読み、いくつかのコード スニペットを使用しましたが、有望に見えます。ただし、私がやろうとしているのは、ヘッダーまたはフッターを除いて、各ページの本文を解析することです。その特定の機能に関するガイダンスは見つかりませんでした。
現在、VB.NET または C# で itextsharp dll を使用して PDF コンテンツを読み込んでいるスニペットを使用していますが、ページ内のすべてのテキストを解析します。体を手に入れる方法があるに違いない。または、少なくとも私はそう願っています。