コンピューター ビジョンで遊ぶために使用したい小さなサイド プロジェクトがあります。いくつかの単語が丸で囲まれている、または両端が曲線で結合された 2 本の平行な水平線で囲まれている文書をスキャンしました。小学生が取り組む単語検索ワークシートに似ていますが、よりきれいな線と水平のみです。
目標は、丸で囲まれたビットを抽出し、それらの部分のみを OCR プロセスに渡して、丸で囲まれたテキストを取得することです。
パッケージ化された haar カスケードのいくつかを使用して、顔認識に opencv を少し前に使用しました。同様のアプローチは単純な形状でも機能しますか、それとも OpenCV 内でうまく機能する低レベルのアプローチはありますか?