Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
PDFコンテンツストリームを解析して段落境界を識別する方法はありますか? ISO 32000-1:2008 を読みましたが、pdf コンテンツ ストリームに、表示ソフトウェアに段落の開始または終了を指示する演算子が含まれているかどうかを理解できませんでした。テキスト抽出ソフトウェアは、その情報を気に入っpdfboxたりxpdf提供したりできますか?
pdfbox
xpdf