私はtess4Jプロジェクトに取り組んでおり、tess4jを使用して、画像内の単語の座標を取得しました。唯一の問題は、これらが TIFF 画像の座標であることです。私のプロジェクトでは、pdf ドキュメントの画像の上にテキストのレイヤーを書き込みます。PDFドキュメントの解像度は72dpiだと思います。そのため、座標が変形し、配置が広すぎます。解像度を 300 dpi から 72 dpi に下げて、画像を tessaract に渡すことができれば、必要な座標を取得できませんか? そうでない場合、代替手段はありますか?既に座標に 300/72 を掛けてみました。驚くべきことに、それはうまくいきません。
前もって感謝します!