5

オーバーレイ HTML を画像にレンダリングする OCR ソフトウェアを探しています。現在、名前のない製品を使用しています。画像付きの PDF ドキュメントのインライン OCR を実行する OCR 機能があります。

インライン OCR は非常に便利で、画像付きの PDF ドキュメントでテキストを検索できます。また、ドキュメント内のテキストを直接強調表示することもできます。OCR テキストは下にある画像に合わせて配置されます。残念ながら、名前のない製品内からインライン OCR をエクスポートしたり保存したりすることはできません。

インライン OCR を実行およびエクスポートできる他のソフトウェアはありますか? 下の画像に合わせて配置された段落で構成される HTML にエクスポートすることに特に興味があります。

参照:
https://stackoverflow.com/questions/11404805/ocr-and-the-location-of-the-image-where-the-scanned-document-came-from

4

2 に答える 2

1

私はあなたのために可能な解決策を持っています。ただし、この特定のソリューションにはいくつかの欠点があり、最終的な目標を妨げる可能性があります。

最初に画像ファイルを pdf に変換します: http://finereader.abbyyonline.com次に、 http ://document.online-convert.com/convert-to-html で pdf を html に変換します。

このソリューションは、紙のサイズに関するもので機能し、最終結果には画像オーバーレイを含む html があります。必要なのが画像フォーマットの html だけである場合は、画像を完全に透明にします。

于 2013-06-19T23:59:20.810 に答える