こんにちは私はコンテンツベースの画像検索に関連するプロジェクトを持っています。このプロジェクトでどのような基準をとるべきか疑問です。これを検索すると、特徴抽出と画像セグメンテーション、および領域操作の2つの方法がありました。どちらの方法がより効率的ですか?
1 に答える
4
ない。この質問への回答には、yor側での再調査が必要になります。画像認識は通常、次の手順で行われます
- 不要な機能を除外するためのいくつかの前処理(コンテキストに応じて、テキスト認識の場合は画像を2値化し、顔認識の場合はグレースケールにすることができます...)
- 関心領域の検索(テキスト認識の場合は、テキスト行/グリフを検索しようとします。顔の場合は、haarカスケードを適用して、顔がどこにあるかを検索します。これも画像セットによって異なります)
- 特徴抽出(さまざまな方法があります。Huのようないくつかの形状の不変モーメントは良い解決策です。顔の場合、ゼルニケモーメントでより良い結果を得ることができます-それらは極座標に基づいています)
- マッチング(簡単な部分:いくつかの特徴ベクトル(通常は2倍)があり、それを他の特徴ベクトル/ベクトルのクラスと一致させる必要があります-ここではクラスター分析を行いますが、さまざまな手法もあります)
JavaOCRプロジェクト(Androidのテキスト認識)ですべてが一緒に動作しているのを見るかもしれませんが、リリースはかなり古いので、ソースからコンパイルしてください):
于 2012-05-04T07:39:09.513 に答える