4

参照画像のセット(200)とそれらの画像の写真のセット(数万)があります。各写真を半自動で分類する必要があります。このタスクに使用するようにアドバイスするアルゴリズムとオープンソースライブラリはどれですか?私にとって最良のことは、写真と参照画像の類似度を測定することです。これにより、人間のオペレーターに、最も類似しているものから最も類似していないものの順に並べられた画像を表示して、作業を容易にします。

もう少しコンテキストを与えるために、参照画像はブランドパッケージであり、写真は同じパッケージですが、フラッシュからの反射、低照度、不完全な視点など、あらゆる種類のノイズが含まれています。写真はすでに(手動で)セグメント化:パッケージのみが表示されます。

15年前のように画像認識を使っていた頃は、おそらく参照画像を使ってニューラルネットワークをトレーニングしようとしていたでしょうが、今ではこれを行うためのより良い方法があるのではないかと思います。

4

4 に答える 4

5

Pythonを使用し、数値計算にはNumPy/SciPyライブラリを使用することをお勧めします。画像を処理するのに役立つライブラリには、Mahotasライブラリとscikits.imageライブラリがあります。

さらに、非常に標準的なSVM実装であるLibsvmのPythonラッパーであるscikits.learnを使用することをお勧めします。

難しいのは、記述子を選択することです。記述子は、各画像から計算する特徴であり、参照画像のセットとの類似距離を計算することを目的としています。試してみるのに適したセットは、方向付けられたグラデーションのヒストグラム、SIFT機能、および色ヒストグラムであり、画像のさまざまな部分をビニングし、そのような記述子を連結するさまざまな方法を試してみてください。

次に、トレーニング用にデータの一部を取っておきます。これらのデータについては、それらが属する実際の参照画像に従って手動でラベルを付ける必要があります。これらのラベルをscikits.learnの組み込み関数にフィードして、画像を認識するようにマルチクラスSVMをトレーニングできます。

その後、PythonでのMPIの実装であるMPI4Pyを調べて、残りの数万の画像の大規模な記述子の計算と分類を行うときにマルチプロセッサを利用することをお勧めします。

あなたが説明するタスクは非常に難しく、それを高精度で解決することは、コンピュータビジョンの分野で研究レベルの出版物に簡単につながる可能性があります。私はあなたにいくつかの出発点を与えたことを願っています:Googleで上記の概念のいずれかを検索すると、有用な研究論文とさまざまなライブラリの使用方法に関する詳細が見つかります。

于 2012-04-12T02:47:43.210 に答える
1

私にとって最良のことは、写真と参照画像の類似度を測定することです。これにより、人間のオペレーターに、最も類似しているものから最も類似していないものの順に並べられた画像を表示して、作業を容易にします。

人々がこれを行う1つの方法は、いわゆる「地球の発動機の距離」を使用することです。簡単に言うと、画像内の各ピクセルを、ピクセル値に対応する高さの岩のスタックとして想像し、2つの画像間の距離を、岩の配置を別の配置に転送するために必要な最小限の作業量として定義します。

このためのアルゴリズムは、現在の研究トピックです。1つのMATLABは次のとおりです:http ://www.cs.huji.ac.il/~ofirpele/FastEMD/code/ 。Javaバージョンもあるようです。元の論文とCコードへのリンクは次のとおりです:http://ai.stanford.edu/~rubner/emd/default.htm

于 2012-04-12T03:05:24.573 に答える
0

IMMI(Image Mining Extension、http: //www.burgsys.com/mumi-image-mining-community.php)でRadpiminer(最も広く使用されているデータマイニングプラットフォームの1つ、http: //rapid-i.com)を試してください)、AGPLライセンス。

現在、いくつかの類似度測定方法を実装しています(ピクセルごとの比較だけでなく)。類似度の測定値は、学習アルゴリズム(ニューラルネットワーク、KNN、SVMなど)に入力でき、パフォーマンスを向上させるためにトレーニングできます。メソッドに関するいくつかの情報は、このペーパーに記載されています: http ://splab.cz/wp-content/uploads/2012/07/artery_detection.pdf

于 2012-11-12T17:35:31.867 に答える
0

TorchTensorflowTheano、Kerasなどの今日のディープラーニングベースのフレームワーク、オブジェクトの分類/認識タスクに最適なオープンソースツール/ライブラリです。

于 2016-10-05T11:27:08.517 に答える