0

ここに示されているものと同様に、PDF ページのテキスト、画像、およびパスの領域の境界ボックスを決定できるようにしたいと考えています。

http://www.windjack.com/products/screenshot/pdfcanscreenshot2.html

PDF の仕様を見ると、パスと画像のバウンディング ボックスを決定する方法はわかりますが、テキストの境界ボックスに到達する方法はわかりません。フォントサイズなどからグリフの高さと幅を決定して、手で計算する必要がありますか、それとももっと簡単な方法がありますか?

4

1 に答える 1

2

「PDFドキュメントから文字オフセット情報を取得するにはどうすればよいですか?」という解決策から始めることができる場合があります。 これにより、ドキュメント内の文字やサブストリングのx、y、幅、高さがわかります。そこから、より難しい部分は、キャラクターのグループを空間的に異なる領域にバインドすることです。ページ上の空間的にグループ化されたテキストが、ファイル形式の構文で互いに近くなるという保証はありません...

于 2009-06-18T02:07:56.583 に答える