ノードを表すランダムなデータポイント間のクラスターを見つけるために、さまざまなデータクラスタリングアルゴリズムをいじっています。データクラスタリングが画像認識に使用されていることを読み続けています。接続に失敗しています。クラスタリング データは、画像の認識や顔認識にどのように役立ちますか。誰かがこれを説明できますか?
1 に答える
クラスタリングがパターン認識全般、特に画像認識に使用されることは当然のことです。クラスタリングは削減プロセスであり、このメガピクセル時代の画像は煮詰める必要があります...それはカテゴリを生成するプロセスでもあり、それはもちろん使える。
ただし、画像認識の手法としてクラスタリングを使用する方法は多数あります。この多様性の理由の 1 つは、クラスタリングがさまざまな目的のためにさまざまなレベルで適用できることです。つまり、基本的なピクセル レベルから特徴レベル (特徴は線、幾何学的図形など) まで、分類やその他の目的のために適用できます。
非常に高いレベルでは、クラスタリングは統計ツールであり、特定のアイテムが特定のカテゴリに属していることを定義する際に、さまざまな次元の相対的な重要性を発見するのに役立ちます。
そのようなツールの [多くの] 使用法のうちの 1 つは、教師あり学習を使用することです。これにより、人間が選択した一連のアイテム (画像など) が、特定のアイテムに関連付けられたラベルと共にクラスターベースのロジックに供給されます ( 「これはリンゴです」、「これは別のリンゴです」、「これはレモンです」...)、クラスタリング ロジックは、アイテムの各グループ (リンゴ、レモン.. .) 明確なクラスターに収まります (たとえば、色は比較的重要ではありませんが、形状、またはドットの存在、またはその他の重要な要素が重要になる場合があります)。このトレーニング フェーズの後、新しい画像をロジックに供給することができ、この画像が特定のクラスターにどれだけ近いかを確認することで、(バナナとして!) 「認識」されます。
画像処理に関しては、クラスタリング ロジックに「供給」されるものは、必ずしも (実際にはめったに) 生のピクセルではなく、元のデータのさまざまな「要素」を特徴付けるさまざまな「オブジェクト」(本質的には比較的高次元のベクトルのコレクションであり、他のデータ クラスタリングの例で遭遇する可能性のあるものとは異なり、プロセスの前の段階で生成されます。たとえば、顔認識の重要な要素は、おそらく目の中心間の正確な距離です。前の段階で、画像は目の位置を特定する方法で処理されます (別のクラスタリング ベースのロジックに依存している可能性があります)。次に、目の間の距離と他の多くの要素が、最終的なクラスタリング ロジックに送られます。
前述の説明は、画像認識にクラスタリングを使用する 1 つの例にすぎません。実際、この分野ではさまざまな形式のニューラル ネットワークが使用され、非常に成功しており、ある意味で、これらのニューラル ネットワークは情報のクラスタリングであると言えます。ニューラル ネットワークが成功した理由の 1 つは、元の入力に見られる局所性次元をより尊重する能力と、階層的な方法で機能する能力にある可能性があります。
この記事の良い結論は、オンライン リソースの短いリストですが、現時点では時間に追われています...「続きを読む」;-)
翌日編集: (この件に関する入門的なオンライン参考文献を提供する試みは失敗しました)
人工視覚と画像処理に適用されるクラスタリングのトピックに関する文献を検索したところ、2 つの異なる... クラスタが見つかりました ;-)
- Algorithms for image processing and computer vision J Parkey pub Wiley、またはMachine Vision : Theory, Algorithms, Practicalities M Seul et. アル・ケンブリッジ UP. そのような本は一般に、ノイズ削減、エッジ検出、色または強度変換、および画像処理チェーンの他の多くの要素に関連するすべての重要な技術をカバーしています。パターン認識やその他のタスクに適用されるクラスタリングについて 2 つ、またはマイナーな言及です。
- 人工視覚などに適用されるクラスタリング手法を具体的にカバーしているが、最も狭く深い方法でカバーしている学術論文および会議ハンドブック (例: 文字認識への応用のための福永およびナレンドラ アルゴリズムのバリエーション、または最近傍の選択のための高速な方法)どのような状況でも候補者。)
要するに、私は特定の本や記事の提案をする準備ができていないと感じています.
「人工視覚」や「画像認識」、または上記のタイトルの一部を入力して、たとえばGoogleブックのタイトルを閲覧すると有益な場合があります。プレビュー機能と、「この本について」リンクにあるタグ クラウド (クラスタリングの別のアプリケーション) を使用すると、さまざまな本の内容を把握し、そのうちのいくつかを購入することを決定できます。残念なことに、読者数の減少と、この分野で有利になる可能性のあるアプリケーションにより、これらの本は比較的高価になっています。スペクトルの反対側では、この分野の高度なトピックについて説明している研究論文を、場合によっては無料でダウンロードできます。これらは、通常の (ウェブ) Google、またはCiteSeerなどの専門のリポジトリにも表示されます。
その分野でのあなたの探求を頑張ってください!