0

まず、私の英語でごめんなさい。tesseractについて質問があります。認識したい画像をきれいにせずに、グラフィックまたは画像内のテキストを認識する方法はありますか? 最初に画像をきれいにし、グラフィックスと写真を削除し、テキストのみを残すためにそこで読んだもの. しかし、ユーザーがサーバーにアップロードして、人間の介入なしにこのニュースを認識できる新聞の切り抜きを望んでいます。それは難しいかもしれません。しかし、他の方法を知っていれば、彼らは感謝しています。どうもありがとうございました

4

1 に答える 1

0

いいえ、できません。

Tesseract は、テキストを読むためだけに作られています。テキストと画像の両方を含む対象に対して OCR を実行すると、Tesseract は画像内で見つけたものを吐き出します (文字化けしたがらくた)。

ただし、画像領域を検出して切り取ることはできます。質問した方が良いと思います。

于 2011-06-06T23:26:41.190 に答える