画像を分析して内部のテキストを抽出するpython/rubyのライブラリを知っている人はいますか?
または画像処理などに関する本...
PS:テキストはさまざまなフォントと形式ですが、明確です。Tl; Dr:キャプチャなどはありません。
画像を分析して内部のテキストを抽出するpython/rubyのライブラリを知っている人はいますか?
または画像処理などに関する本...
PS:テキストはさまざまなフォントと形式ですが、明確です。Tl; Dr:キャプチャなどはありません。
オープンソースのコンピュータービジョンライブラリであるOpenCVを使用でき、PythonAPIを備えています。現在、業界標準のライブラリと見なされています。
OpenCV公式サイト: http: //opencv.org/
OpenCV-Pythonに関するチュートリアルが必要な場合は、 opencvpython.blogspot.comにアクセスしてください。
このSOFを確認することもできます:OpenCVの単純な数字認識OCR-Python
それに加えて、OpenCVサンプルにはいくつかのOCR実装があります。
ただし、OCRにはTesseractを使用することをお勧めします。これは、HPによって開発された最高のオープンソースOCRエンジンですが、現在はGoogleによって処理されています。
Tesseractサイト:https ://github.com/tesseract-ocr/tesseract
tesseractのPythonAPI、Pytesser:https ://github.com/RobinDavid/Pytesser
このSOFも確認してください:TesseractとOpenCVのどちらを選択するにはどうすればよいですか?
したがって、OpenCVを使用して画像を前処理し、TesseractforOCRを使用できます。