画像からアラビア数字 (アラビア語 - インド語) を検出しようとしています。
Tesseract OCRを試してみましたが、うまくいきませんでした(アラビア語の単語は認識しますが、数字は認識しません)。これは、そこからページ番号を抽出したい画像です(ページの上部)
私は imagemagick を試して、その画像を、すべての本の番号の可能性を含む、既に作成された小さい画像と比較しましたが、うまくいきませんでした。時間がかかると思います.
実用的で複雑でない解決策は何でしょうか? PS: 画像は Android 携帯からのもので、Windows または Linux サーバーで解析されます。