パターン認識のためにニューラルネットワークをどのようにトレーニングしますか?たとえば、画像の顔認識では、出力ニューロンをどのように定義しますか?(たとえば、カメラに顔があると言うだけでなく、顔がどこにあるかを正確に検出する方法)。また、複数の顔や異なるサイズの顔を検出するのはどうですか?
誰かが私にポインターを与えることができればそれは本当に素晴らしいでしょう
乾杯!
パターン認識のためにニューラルネットワークをどのようにトレーニングしますか?たとえば、画像の顔認識では、出力ニューロンをどのように定義しますか?(たとえば、カメラに顔があると言うだけでなく、顔がどこにあるかを正確に検出する方法)。また、複数の顔や異なるサイズの顔を検出するのはどうですか?
誰かが私にポインターを与えることができればそれは本当に素晴らしいでしょう
乾杯!
一般的に言って、私は問題を複数の段階に分割します。
1-写真に顔はありますか?
2-写真の顔はどこにありますか?
3-写真の顔はNN(神経ネットワーク)が認識する顔ですか?
いずれの場合も、個別のNNを作成し、提起された質問に答えるようにトレーニングすることをお勧めします。
NNの構造については、入力データと目的の出力に依存するため、答えるのは少し難しいです。たとえば、100x100ピクセルの画像がある場合、10,000回の入力が可能だと思います。事前に前処理を行って、予測可能な輪郭に多数の楕円が存在するかどうかを確認できるように楕円を検出することを検討することをお勧めします(顔用に1つ、目用に2つ、口用に1つ)。 。データを前処理している場合は、楕円形ごとに入力がある可能性があります。
ここで、出力について...質問1の場合、入力データに顔があることをNNがどの程度確信しているかを示す出力を1つだけ持つことができます。つまり、値は0.0(顔がない)-> 1.0(顔がない)です。 )。このようにして、ステージ2と3に進むことができます。
この時点で、これは重要な問題であり、 OpenCVなどの利用可能なフレームワークのいくつかを確認したほうがよいかもしれません。
トレーニングの部分では、NNをトレーニングするために利用できる画像の備蓄を用意する必要があります。NNをトレーニングする方法はいくつかあります。考えられる解決策の1つは、バックプロパゲーション1、2と呼ばれる手法を使用することです。一般的に、画像でNNを使用し、それを所定の出力と比較します。間違っている場合は、NNを微調整して目的の出力を生成し、繰り返します。
AIに関する優れた本が必要な場合は、人工知能:ラッセルとノーヴィグによる現代的なアプローチを強くお勧めします。より適切なコンピュータビジョンの教科書があると確信していますが、ラッセルとノーヴィグの本は優れたスターターです。
親愛なるGantengX、あなたは答えがとても大きく、複雑で、理解するのが難しいという事実にあなた自身を準備するべきです。パターンと顔認識には非常に多くのアプローチがあります。そして、実際の顔認識システムを実装することは、一人では決して処理できない膨大な数の作業です。数学と人工知能に関する本の裏で少なくとも10年間の人生の準備をしてください。私は、あなたが何をしてほしいかを理解する5人の高給の開発者を最終的に雇うことについて話していません。そして多分あなたはあなた自身の顔認識システムを持つことになるでしょう。プロセス中に飛び出す他の問題もたくさんあります。だから、ストレスや問題に満ちた人生の準備をしてください。
明白なことを言って申し訳ありませんが、あなたの質問は具体的ではありませんでした。完全な答えは多くの異なる科学分野に触れ、1,000ページを超える本になります。あなたの質問について(短い答え)。
各顔認識アプリは、次の主要な部分で構成されています。
項目1と2は各システムの中心部分であり、実際の作業を行います。その他の前処理を行うと、入力データの複雑さが軽減され、AIの決定が容易になります。最初の結果が得られるまで、3。と4.を開始しないでください。
PS既存のソリューションを使用する方が費用対効果が高くなりますが、物事を勉強している場合は、私のように時間を無駄にせず、すぐに論文を始めてください。