Ubuntu 12.04 を実行しているマシンで特定のテキストを含む画像を探しています
たとえば、次の画像のように、「Some text here」を探しているとします。
ハードドライブでそのテキストを含む大きな画像を見つけられるようにしたい:
私のマシンを検索する方法はありますか?
ヒントをありがとう!
tesseractをチェックしてください。それは仕事をするはずです: https://code.google.com/p/tesseract-ocr/wiki/ReadMe
以下を実行できます。
tesseract Sometext_big.png out.txt
そして、out.txt には「Some text here」が含まれます。
次に、シェル スクリプトを呼び出しfind
て特定のタイプのすべての画像を検索し、それらを tesseract で実行して、出力ファイルに必要なテキストが含まれているかどうかを確認するだけです。