1

私はそれが何を言っているのか知りたくありません、そしてそれはCAPTCHAのような歪みを扱っていません、私はただたくさんの画像がテキストを含んでいるかどうか知りたいです。

これは、いくつかのアイドル状態のLinuxサーバーで実行されるものであり、cronジョブは1日に複数回大量の画像を処理します。

その過程で私がやりたいことの1つは、テキストを含む画像を破棄することです。誤検知は問題ありませんが、可能な限り破棄する必要のあるテキストを含む画像を識別する場合は、失敗率をゼロパーセントに近づけたいと思います。

4

1 に答える 1

2

Tesseract-OCRは、GoogleがGoogleブックスに使用するものです。試してみる。

于 2009-07-04T05:01:00.837 に答える