2

私の質問を見てくれてありがとう。

基本的に私がやろうとしているのは、ここで最初と3番目の画像のように見えるすべての画像を見つけることです:http://imgur.com/a/IhHEC

そのように見えないものをすべて削除します(2,4)。

私は何の役にも立たないいくつかのライブラリを試しました。

これを行うもう1つの許容可能な方法は、画像に「Code:」が含まれているかどうかを確認することです。これは、その文字列が、整理する必要のある各画像に含まれているためです。

ありがとう、スティーブ

編集:1番目と3番目の画像は同じサイズのように見えますが、そうではありません。

4

2 に答える 2

4

それらが使用する実際の画像である場合、ヒストグラムの類似性が機能するようです。1 番目と 3 番目は非常に対照的で、2 番目と 4 番目、特に 4 番目は、さまざまな強度の範囲があります。

画像内のグレーの色合いのヒストグラムを簡単に作成し、ヒストグラムの形状にしきい値を適用してそれらを分類できます。

編集:実際にこれを行うには:すべてのピクセルを繰り返し処理し、ピクセル値の配列を作成する=>見つかった回数。グレースケールなので、R、G、または B チャンネルのいずれかを取ることができます。次に、各数値を画像内のピクセル数で割って正規化し、どのサイズでも機能するようにします。ヒストグラムの各エントリは、使用されるピクセル数の一部になります。その後、特定のしきい値を超える値の数を測定できます。グレーがたくさんある場合、多数の小さな値が得られます。そうでない場合は、少数の大きな値が得られます。

于 2012-10-20T20:39:20.450 に答える
0

画像オブジェクトよりも画像のテキストを扱う経験が多いため、テキスト コンテンツで「キーワード」を検索するか、目的のデータを表す「正規表現」をチェックして、OCR 後のプロセスでこれを行います。これは、ジョブ全体を 2 つの段階に分ける必要があることを意味します。イメージからテキストへの OCR (無料または安価、ソフトウェアまたはクラウド)、および実際の分離プロセス (簡単なプログラミング) です。

于 2012-10-24T17:46:33.317 に答える