2

文字を検出する画像認識ソフトウェアを開発しています。文字「J」で写真を撮ると、ソフトウェアが画像をモデルと比較して文字「J」を検出するように、文字(たとえば「J」)のモデルを作成する方法を考えていました。 "。モデルを作成するにはどうすればよいですか?

4

3 に答える 3

2

OCR(光学式文字認識)をしたいようです。

これがより大きなプロジェクトの一部にすぎない場合は、OpenCV を試してください。商用製品を作成している場合でも、寛大な BSD ライセンスが適用されます。

独自のライブラリを作成することに着手した場合は、優れた検索エンジンで入手できる論文をいくつか読んでください。必要な画像モデルを生成できる、機械学習とニューラル ネットワークのチュートリアルが多数あります。

于 2013-01-02T22:25:07.313 に答える
0

これを行う場合は、正規化されたフロートを使用します。

文字Aは次のようになります:[(0.0,0.0)、(0.5,1.0)、(1.0,0.0)、(0.1,0.5)(0.9,0.5)]

更新(詳細説明)

だから私の考えは、正規化された点の配列で文字を一意に識別できるはずだということです。ポイントは、線の始点、終点、中点など、文字の重要な特徴にあります。曲線は複数の小さな線分にスライスされ、これも点で表されます。

このモデルを使用するには、ソース画像を分析します。次に、画像のテキストを分析します。エッジ検出やその他の方法を使用してテキストを見つけることができます。また、テキストの変換を分析する必要があります。テキストの変換を理解したら、テキストを文字に分割し、重要な機能のポイントについて文字を分析します。次に、ポイントを正規化するアルゴリズムを記述し、見つかったポイントを最も正確に表すモデルを決定します。

于 2013-01-02T22:31:02.510 に答える
0

Java 用の OpenCv ライブラリを使用できます。このライブラリには既に実装されているテンプレート マッチング モデルが含まれていますが、画像認識には学習機械またはニューラル ネットワークを使用する方が良いでしょう。

于 2013-01-02T22:16:49.527 に答える