3

画像を分析して内部のテキストを抽出するpython/rubyのライブラリを知っている人はいますか?

または画像処理などに関する本...

PS:テキストはさまざまなフォントと形式ですが、明確です。Tl; Dr:キャプチャなどはありません。

4

1 に答える 1

15

オープンソースのコンピュータービジョンライブラリであるOpenCVを使用でき、PythonAPIを備えています。現在、業界標準のライブラリと見なされています。

OpenCV公式サイト: http: //opencv.org/

OpenCV-Pythonに関するチュートリアルが必要な場合は、 opencvpython.blogspot.comにアクセスしてください。

このSOFを確認することもできます:OpenCVの単純な数字認識OCR-Python

それに加えて、OpenCVサンプルにはいくつかのOCR実装があります。

ただし、OCRにはTesseractを使用することをお勧めします。これは、HPによって開発された最高のオープンソースOCRエンジンですが、現在はGoogleによって処理されています。

Tesseractサイトhttps ://github.com/tesseract-ocr/tesseract

tesseractのPythonAPI、Pytesserhttps ://github.com/RobinDavid/Pytesser

このSOFも確認してください:TesseractとOpenCVのどちらを選択するにはどうすればよいですか?

したがって、OpenCVを使用して画像を前処理し、TesseractforOCRを使用できます。

于 2012-07-15T10:00:49.207 に答える