画像内の文字を検索し、それらの文字の位置と境界ボックスを返す Python または C++ ライブラリを探しています。ライブラリに例を含むドキュメントがある場合、これはプラスです。
ライブラリが単語を認識できることは重要ではありません。
文字は難読化されておらず、Arial などの単純なフォントです。
画像内の文字を検索し、それらの文字の位置と境界ボックスを返す Python または C++ ライブラリを探しています。ライブラリに例を含むドキュメントがある場合、これはプラスです。
ライブラリが単語を認識できることは重要ではありません。
文字は難読化されておらず、Arial などの単純なフォントです。
これを行うための標準ライブラリを認識していません。ただし、この種のタスクにはさまざまな論文や例があります。基本的には、画像を前処理してテキストを検索し、境界ボックスを決定する必要があります。たとえば、いくつかのことについては、このstackoverflowスレッドを参照してください。
これを実装するには、 OpenCVなどのライブラリが役立つ場合があります。