tesseract - グラフィックまたは画像内のテキストをtesseractで認識する方法はありますか?

Question

まず、私の英語でごめんなさい。tesseractについて質問があります。認識したい画像をきれいにせずに、グラフィックまたは画像内のテキストを認識する方法はありますか? 最初に画像をきれいにし、グラフィックスと写真を削除し、テキストのみを残すためにそこで読んだもの. しかし、ユーザーがサーバーにアップロードして、人間の介入なしにこのニュースを認識できる新聞の切り抜きを望んでいます。それは難しいかもしれません。しかし、他の方法を知っていれば、彼らは感謝しています。どうもありがとうございました

score 0 · Accepted Answer

いいえ、できません。

Tesseract は、テキストを読むためだけに作られています。テキストと画像の両方を含む対象に対して OCR を実行すると、Tesseract は画像内で見つけたものを吐き出します (文字化けしたがらくた)。

ただし、画像領域を検出して切り取ることはできます。質問した方が良いと思います。

tesseract - グラフィックまたは画像内のテキストをtesseractで認識する方法はありますか?

1 に答える 1

Related

Reference