OCR システムを開発していて、単語の分割について助けが必要です。
現在、OCR システムは一列に並んだブロブを検出します (連結成分ラベリング アルゴリズムを使用)。各ブロブは個別の文字を表し、周囲にバウンディング ボックスがあります。一部の文字は、バウンディング ボックスで重なる場合があります。
それらの文字を単語に結合するにはどうすればよいですか? 単語を互いに分離する最適な距離を決定する方法: 1. 単語が切断されない 2. 単語が他の単語に結合されない 私が見たものから - 文字と単語の間の距離は異なる場合があります多く。
この部分は文字分類の前に行われるため、実際の単語の意味で区切ることはできません。
ありがとうございました!