1

地域の言語の文字認識を行っています。画像を抽出している間、ドットは文字として個別に識別されます。

%% Plot Bounding Box
for n=1:size(propied,1)
rectangle('Position',propied(n).BoundingBox,'EdgeColor','g','LineWidth',2)
end
hold off

%% Characters being Extracted
figure
 for n=1:Ne
 [r,c] = find(L==n);
 n1=imagen(min(r):max(r),min(c):max(c));
 imshow(~n1);
 end

元のコード: http: //www.mathworks.com/matlabcentral/fileexchange/22922-image-segmentation-extraction

4

1 に答える 1

0

文字/テキスト認識を行っているため、個々の文字ではなく、単語またはテキスト行のコレクションが必要になる可能性が高くなります。そして、本当に後者を実行したい場合は、個々の単語を識別した後、より堅牢になります。

したがって、ここでの最も簡単なアプローチは、標準の形態学的な開始(テキストが黒であると想定し、それ以外の場合は終了を使用する)演算子を使用することです。大きな水平構造要素(SE)から始めます。このSEで開口部を適用すると、画像がテキスト行に分割されます。各行で、短い水平SEを使用して、個々の単語を取得します。次に、単語ごとに、アクセントやその他の活字の詳細を結合するように開くための垂直SEを検討します。

たとえば、入力画像は、水平方向のSEが半径35の開口部、水平方向のSEが半径7の開口部、垂直方向のSEが半径7の開口部です。

ここに画像の説明を入力してください ここに画像の説明を入力してください ここに画像の説明を入力してください ここに画像の説明を入力してください

分離されたコンポーネントに3番目の操作を適用しませんでしたが、2行のテキストを結合するリスクを回避するために適用する必要があります。もちろん、これはすべてテキストの直線の水平線を想定しています。この最終的な画像にバウンディングボックスを描画すると、次のような結果が得られます。

ここに画像の説明を入力してください

一部の文字(「ty」と「ny」)は最初に接続されていたため、この出力では1文字として表示されることに注意してください。これは別の問題であり、問​​題になる場合とそうでない場合があります。

于 2013-02-14T02:06:08.000 に答える