2

これは、直接的なプログラミングの質問ではなく、調査の質問です。

私はシンボル認識アルゴリズムに取り組んでいます。ソフトウェアが現在行っていることです。画像を取得し、それを輪郭(ブロブ)に分割し、各輪郭を事前定義されたテンプレートのリストと照合し始めます。次に、輪郭ごとに、一致率が最も高い輪郭を取得します。

アルゴリズムはかなりうまくいっていますが、私はそれをより良く訓練する必要があります。つまり、より適切に一致するようにアルゴリズムをトレーニングする機械学習アルゴリズムを使用したいと思います。例を見てみましょう:

シンボルに対して認識を実行すると、アルゴリズムが実行され、このシンボルが車であることがわかります。次に、アルゴリズムがその結果から学習する結果を確認する必要があります([はい]または[いいえ]をクリックして)。したがって、[いいえ]をクリックすると、アルゴリズムはこれが車ではなく、次回はより良い結果が得られることを学習するはずです(おそらく他の何かと一致させてみてください)。[はい]をクリックすると、彼は自分が正しかったことがわかり、次回は車を探すときにパフォーマンスが向上します。

これが私が研究しようとしている概念です。このようなことを実現できるドキュメントやアルゴリズムが必要です。私は実装やプログラミングを探しているのではなく、概念や研究だけを探しています。

私は多くの研究を行い、機械学習、ニューラルネットワーク、決定木について多くのことを読みました。しかし、シナリオでどのように使用できるかを知ることができませんでした。

私が明確であり、このタイプの質問がスタックオーバーフローで許可されていることを願っています。そうでなければごめんなさい

ヘルプやヒントをありがとう

4

1 に答える 1

5

画像認識は、コミュニティでは依然として課題です。はい/いいえを手動でクリックするプロセスで説明したことは、ラベル付きデータを作成することです。これは非常に広い分野なので、役に立つかもしれないいくつかのリンクを紹介します.

  • まず、独自の画像データベースを作成するのではなく、既存の画像データベースを使用することをお勧めします。これにより、多くの労力を節約できます。たとえば、UCIC image dbのこの車のデータセットです。

  • すでに機械学習のバックグラウンドをお持ちなので、検索object recognition survey paperfeature extraction carGoogle などでプロジェクトの関心に完全に一致するアンケート用紙をご覧ください。

  • 次に、いくつかの優れた論文に飛び込んで、それらがプロジェクトに適しているかどうかを確認できます. たとえば、UCIC image db にリンクされている以下の 2 つの論文を確認できます。

    • Shivani Agarwal、Aatif Awan、Dan Roth による、まばらな部分ベースの表現による画像内のオブジェクトの検出方法の学習。パターン分析とマシン インテリジェンスに関する IEEE トランザクション、26(11):1475-1490、2004 年。
    • Shivani Agarwal と Dan Roth、物体検出のためのスパース表現の学習。第 7 回ヨーロッパ コンピュータ ビジョン会議の議事録、パート IV、113 ~ 130 ページ、コペンハーゲン、デンマーク、2002 年。
  • また、ゼロから始めるのではなく、いくつかの実装されたソフトウェアを確認してください。あなたの場合、opencvは最初から始めるのに適しているはずです。

  • 画像認識において、特徴抽出は最も重要なステップの 1 つです。コミュニティでいくつかの最先端のアルゴリズムを確認することをお勧めします。(SIFT、平均シフト、harr 機能など)。

  • ブースティング アルゴリズムは、分類ステップに到達したときにも役立つ場合があります。画像認識コミュニティで多くの学者がこれについて言及しているのを目にします。

  • @nickbar が示唆するように、https: //stats.stackexchange.com/ でさらに議論してください

于 2012-10-22T21:55:29.193 に答える