3

私は現在、リア側の車両ナンバー プレートを認識するプロジェクトを行っていました。準備段階として OCR を実行しましたが、四角形 (車の関係領域) のライセンスを検出する方法がわかりません。プレート、私は多くの論文を読みましたが、ナンバープレートの長方形の領域を認識することに関する有用な情報を見つけた場所はありません. 私はmatlabを使用してプロジェクトを行っています。誰でもこれで私を助けてください...

どうもありがとう

4

3 に答える 3

3

ほのめかしたように、少なくとも 2 つの異なるフェーズがあります。

  1. 画像内のナンバー プレートの位置
  2. 画像からライセンス番号を認識する

ナンバー プレートにはロケーション マークが埋め込まれていないため (QR コードなどに見られるように)、入力画像の変換範囲を制限することで、画像内のナンバー プレートを認識する複雑さが軽減されます。

多くの ANPR システムの成功は、歪みの予測可能な範囲内にナンバー プレートを配置する画像を取得するためのキャプチャ機器の位置とタイミングの精度に依存しています。

画像がキャプチャされると、統計分析を使用して画像内の「ナンバー プレート」形状の領域、つまり遠近法に適した比率の領域を特定することで、位置フェーズを処理できます。この記事では、そのようなアプローチの 1 つについて説明します。

この論文別の論文では、ソーベル エッジ検出器を使用してナンバー プレートの垂直方向のエッジを特定する方法について説明しています。その理由は、文字が背景に比べてより多くの垂直線を形成するためです.

別の論文では、いくつかの手法 (Sobel 検出と Haar ウェーブレットを含む) の有効性が比較されており、良い出発点になる可能性があります。

于 2011-09-20T11:06:46.730 に答える
3

「OCRベースの車両識別」に関するプロジェクトを完了しました

一般に、LPRは 3 つの主なフェーズで構成されます。取得した画像からのナンバー プレートの抽出、個々の文字を抽出するための画像のセグメンテーション、および文字認識です。ナンバー プレート検出の上記のすべてのフェーズは、気象条件、照明条件、ナンバー プレートの配置、およびナンバー プレートの写真に配置されるフレーム、シンボル、またはロゴなどの他のアーティファクトに非常に敏感であるため、最も困難です。インドでは、ライセンス番号が書かれています。一列でも二列でも。

LPR システムの速度と精度の両方が非常に重要な要素です。一部の文献では、精度レベルは良好ですが、システムの速度は遅くなります。ファジー ロジックやニューラル ネットワーク アプローチと同様に、精度レベルは良好ですが、非常に時間がかかり、複雑です。私たちの仕事では、時間の複雑さと正確さのバランスを維持してきました。ナンバー プレートのローカリゼーションには、エッジ検出法と垂直方向および水平方向の処理を使用しました。エッジ検出は 'Roberts' オペレーターで行われます。セグメンテーションには、いくつかの適切なしきい値を使用した連結成分分析 (CCA) が使用されます。文字認識には、相関関数によるテンプレート マッチングを使用し、マッチングのレベルを高めるために拡張データベースを使用しました。

プロジェクトに対する私のアプローチ

  1. ウェブカメラ/カメラから画像を入力します。
  2. イメージをバイナリに変換します。
  3. ナンバープレートエリアを検出します。
  4. セグメンテーション。
  5. 番号識別。
  6. GUI上に表示します。

ナンバープレート抽出への私のアプローチ

  1. ウェブカメラ/カメラから入力を受け取ります。
  2. グレースケール画像に変換します。
  3. しきい値を計算します。
  4. ロバーツ演算子を使用したエッジ検出。
  5. 水平投影を計算します。
  6. しきい値の 1.3 倍と比較して、画像を水平方向にトリミングします。
  7. 垂直投影を計算します。
  8. 画像を垂直方向にトリミングします。

セグメンテーションに対する私のアプローチ

  1. 抽出した画像をバイナリ画像に変換します。
  2. 抽出されたバイナリ イメージの補完イメージを検索します。
  3. ピクセル値が面積の 2% 未満の連結成分を削除します。
  4. 連結成分の数を計算します。
  5. 連結成分ごとに、行と列の値を見つけます
  6. 動的しきい値 (DM) を計算します。
  7. 特定の条件を適用して、分割された文字から不要な文字を削除します
  8. セグメント化された文字の座標を格納します。

認識のための私のアプローチ

  1. テンプレートを初期化します。
  2. セグメント化された文字ごとに、手順 2 ~ 7 を繰り返します。
  3. セグメント化された文字をデータベース イメージ サイズ、つまり 24x42 に変換します。
  4. 各データベース画像との切り出し文字の相関係数値を求め、その値を配列に格納します。
  5. 配列内の最大値のインデックス位置を見つけます。
  6. そのインデックス値でリンクされている文字を見つけます
  7. その文字を配列に格納します。
于 2013-12-06T09:27:34.167 に答える
1

OpenALPR ( http://www.openalpr.com ) をチェックしてください。OpenCV と LBP/Haar アルゴリズムを使用してプレート領域を認識します。これにより、ライト オン ダークとダーク オン ライト プレート領域の両方を認識することができます。一般的な領域を認識した後、OpenCV を使用して、画像内の強い線/エッジに基づいてローカライズします。

C++で書かれているので、うまくいけばそれを使うことができます。そうでない場合は、少なくともそれは参照です。

于 2014-01-16T16:56:20.633 に答える