c++ - 画像内の文字の位置を見つけるための Python/C++ ライブラリ

Question

画像内の文字を検索し、それらの文字の位置と境界ボックスを返す Python または C++ ライブラリを探しています。ライブラリに例を含むドキュメントがある場合、これはプラスです。

ライブラリが単語を認識できることは重要ではありません。

文字は難読化されておらず、Arial などの単純なフォントです。

score 0 · Accepted Answer

これを行うための標準ライブラリを認識していません。ただし、この種のタスクにはさまざまな論文や例があります。基本的には、画像を前処理してテキストを検索し、境界ボックスを決定する必要があります。たとえば、いくつかのことについては、このstackoverflowスレッドを参照してください。

これを実装するには、 OpenCVなどのライブラリが役立つ場合があります。

1 に答える 1