2

パーツを取り出して 1 つの新しい画像を作成したい画像を扱っています。ImageMagick または OpenCV を利用できます。サンプル画像は次のとおりです。

ここに画像の説明を入力

この画像から、タイトル、注釈付きの 2 つのテキスト (1 つは円形、もう 1 つは四角形)、およびテキストを下から取り出したいと思います。

したがって、最終的な画像には、画像のタイトル、注釈付きのテキスト 1、注釈付きのテキスト、および This is some test が含まれます。イメージのこれらの部分は、新しいイメージで特定の順序である必要はありません。

質問

  • これを行うには、どのような戦略を使用できますか?
  • ハフやキャニーは役に立ちますか?
  • 私が戻したい画像の部分はすべてテキストなので、ハフラインが直線を検出して、画像のそれらの部分を切り取ることができると思います...
  • 私の主な目標は、テキストを抽出してOCRに送信できるようにすることです

私はイメージを侵食しようとしましたが、これを思いつきました:

ここに画像の説明を入力

私の戦略

以下は、白い背景とテキストで画像の一部のみを保持するという私の戦略です。ただし、これがOpenCVで実行できるかどうかはわかりません...

画像にはさまざまなROIがあります

  • 画像の上には常に白い背景があります。このスペースのタイトルと呼びましょう。なので、画像の上にある四角い部分を切り取って、別の画像として保存します
  • 画像の下部には常に白い背景があります。このボディを呼び出しましょう。なので画像下部の四角い部分を切り取って別画像として保存します
  • 画像の上にテキストが表示されます。これを注釈付きテキストと呼びましょう。これは正方形または円になります。この回答で言及されている手法を使用して、画像のこれらの部分を切り取り、別の画像として保存できます。
4

1 に答える 1

0

見た目が似ているフォントだけを扱っていて、非常に効率的なものを探していない場合は、アルファベットの各文字 (上 26 文字と下 26 文字) と単純に関連付けることができます。ピークをしきい値処理し、それらを一緒に追加します。その後、ピークの周囲にバウンディング ボックスを定義するだけです。

于 2013-04-27T05:47:09.733 に答える