c# - iTextSharp 読み取り段落のみ

翻译自：https://stackoverflow.com/questions/18467999 2013-08-27T14:17:25.887

924 次

1

iTextSharpC#を使用してPDFファイルを読み取るために使用しています。関数を使用したテキスト抽出PdfTextExtractor.GetTextFromPage()は、期待どおりにすべてのテキストを返します。

ただし、目次、索引、およびページ番号を含む PDF の場合は、削除する必要があります。そして、テキストの段落を取得したいだけです。

を調べて、オプションの利用可能性を確認しましたITextExtractionStrategy。

私は本当に無知で、どんな指針も役に立ちます。

を使用してフィールドを分離することを検討しましたAcroFieldsが、それはロングショットのように見えます。

ありがとうございました。

よろしく、~Mayur

0 に答える 0