これは、Rectangle を使用してドキュメントの一部を選択し、PDF ファイルからテキストを抽出する「iText の動作」の例です。
PdfReader reader = new PdfReader(pdf);
PrintWriter out = new PrintWriter(new FileOutputStream(txt));
Rectangle rect = new Rectangle(70, 80, 420, 500);
RenderFilter filter = new RegionTextRenderFilter(rect);
TextExtractionStrategy strategy;
for (int i = 1; i <= reader.getNumberOfPages(); i++) {
strategy = new FilteredTextRenderListener(
new LocationTextExtractionStrategy(), filter);
out.println(PdfTextExtractor.getTextFromPage(reader, i, strategy));
}
out.flush();
out.close();
私が理解していないのは、これらの数字 (70、80、420、500) の意味です。通常、(70, 80) は座標、420 は幅、500 は四角形の高さですが、スケール、測定方法、正確な開始点についてはわかりません。誰かが私のためにそれを説明したり、いくつかの例の写真を示したりできますか?