image-processing - 写真と写真を区別する方法は？

Question

次の問題があります。一連の画像が与えられ、OpenCV ライブラリを使用してそれらを写真と画像 (グラフィックス)に分割する必要があります。

私はすでに試しました

RGBヒストグラムを分析する（平均的な画像では、ヒストグラムの空のビンがあります）、
HSVヒストグラムを分析する（平均的な画像では色があまりありません）、
輪郭を検索します (平均して、画像の輪郭の数は写真よりも少なくなります)。

したがって、7％のエラーがあります（2000枚の画像でテスト済み）。私は多くのコンピュータビジョン手段についてあまり経験がないので、少し混乱しています。

例えば、この下の写真。そのヒストグラム (RGB および HSV) は非常に貧弱で、等高線の数はかなり少ないです。さらに、多くの背景色があるため、ヒストグラムのみを計算するオブジェクトを見つける必要があります (これには findContours() を使用します)。しかし、いずれにせよ、私のアルゴリズムはこの画像を picture として検出します。

写真1

もう 1 つの例:

写真2

写真の問題はノイズです。小さなサイズ (200*150) の画像があり、場合によってはノイズが非常に知覚できるため、アルゴリズムがこの画像を写真として検出します。画像をぼかしてみましたが、この場合、ピクセルが混在するために色の数が増加し、輪郭の数も減少します (いくつかの薄暗い境界が見分けがつかなくなります)。

写真の例: 写真1 写真2

カラーセグメンテーションと MSER も試しましたが、最高の結果はまだ 7% です。

また、どのような方法を試すことができるか教えていただけますか?

score 3 · Accepted Answer

あなたのデータセットを使用して、非常に単純なモデルを作成しました。これを行うために、R で Rattle ライブラリを使用しました。

入力データ

 rgbh1 - number of bins in RGB histogram, which value > @param@, in my case @param@ = 30 (340 is maximum value)
 rgbh2 - number of bins in RGB histogram, which value > 0 (not empty)
 hsvh1 - number of bins in HSV histogram, which value > @param@, in my case @param@ = 30 (340 is maximum value)
 hsvh2 - number of bins in HSV histogram, which value > 0 (not empty)
 countours - number of contours on image
 PicFlag - flag indicating picture/photo (picture = 1, photo = 0)

データ探索

データをよりよく理解するために、写真/写真グループごとの個々の変数の分布のプロットを次に示します (y 軸にパーセンテージがあります)。

ここに画像の説明を入力

予測力を持つ変数があることを明確に示しています。それらのほとんどは、私たちのモデルで使用できます。次に、単純な散布図マトリックスを作成して、変数の組み合わせが役立つかどうかを確認しました。

ここに画像の説明を入力

たとえば、countour の数と rgbh1 の組み合わせが有望に見えることがわかります。

次のグラフでは、変数間にも非常に強い相関関係があることがわかります。(一般的に、相関変数の数は限られていますが、相関の低い変数を多く持つことを好みます)。円グラフは相関の大きさを示します。完全な円は 1 を意味し、空の円は 0 を意味します。私の意見では、相関が .4 を超える場合、モデルに両方の変数を含めることはお勧めできません)。

ここに画像の説明を入力

モデル

次に、デシジョンツリー、ランダムフォレスト、ロジスティック回帰、およびニューラルネットワークを使用して、簡単なモデルを作成しました (Rattle のデフォルトを維持)。入力として、データを 60/20/20 に分割して使用しました (トレーニング、検証、テストデータセット)。これが私の結果です (エラーマトリックスがわからない場合は、Google を参照してください)。

Error matrix for the Decision Tree model on pics.csv [validate] (counts):

      Predicted
Actual   0   1
     0 167  22
     1   6 204

Error matrix for the Decision Tree model on pics.csv [validate] (%):

      Predicted
Actual  0  1
     0 42  6
     1  2 51

Overall error: 0.07017544

Rattle timestamp: 2013-01-02 11:35:40 
======================================================================
Error matrix for the Random Forest model on pics.csv [validate] (counts):

      Predicted
Actual   0   1
     0 170  19
     1   8 202

Error matrix for the Random Forest model on pics.csv [validate] (%):

      Predicted
Actual  0  1
     0 43  5
     1  2 51

Overall error: 0.06766917

Rattle timestamp: 2013-01-02 11:35:40 
======================================================================
Error matrix for the Linear model on pics.csv [validate] (counts):

      Predicted
Actual   0   1
     0 171  18
     1  13 197

Error matrix for the Linear model on pics.csv [validate] (%):

      Predicted
Actual  0  1
     0 43  5
     1  3 49

Overall error: 0.07769424

Rattle timestamp: 2013-01-02 11:35:40 
======================================================================
Error matrix for the Neural Net model on pics.csv [validate] (counts):

      Predicted
Actual   0   1
     0 169  20
     1  15 195

Error matrix for the Neural Net model on pics.csv [validate] (%):

      Predicted
Actual  0  1
     0 42  5
     1  4 49

Overall error: 0.0877193

Rattle timestamp: 2013-01-02 11:35:40 
======================================================================

結果

ご覧のとおり、全体的なエラー率は 6.5% から 8% の間で変動します。使用するメソッドのパラメーターを調整することで、この結果が大幅に改善されるとは思いません。全体的なエラー率を下げる方法は 2 つあります。

相関関係のない変数を追加します (通常、モデリングデータセットには 100 以上の入力変数があり、最終モデルには +/- 5 ～ 10 があります)。
さらにデータを追加します (オーバーフィッティングに怯えることなくモデルを調整できます)

使用ソフトウェア:

R http://www.r-project.org/
ラトルhttp://rattle.togaware.com/

コーグラムと散布図の作成に使用されるコード (他の出力は Rattle GUI を使用して生成されました):

# install.packages("lattice",dependencies=TRUE)
# install.packages("car")

library(lattice)
library(car)

setwd("C:/")

indata <- read.csv2("pics.csv")

str(indata)


# Corrgram
corrgram(indata, order=TRUE, lower.panel=panel.shade,
         upper.panel=panel.pie, text.panel=panel.txt,
         main="Picture/Photo correlation matrix")

# Scatterplot Matrices
attach(indata)
scatterplotMatrix(~rgbh1+rgbh2+hsvh1+hsvh2+countours|PicFlag,main="Picture/Photo scatterplot matrix",
                  diagonal=c("histogram"),legend.plot=TRUE,pch=c(1,1))

score 1 · Accepted Answer

役立つはずの機能の1つは、勾配ヒストグラムです。自然画像には、勾配強度の特定の分布があります。

score 1 · Accepted Answer

一般的な提案は、機能の数を増やす (またはより良い機能を取得する) ことと、適切な機械学習アルゴリズムでトレーニングされたこの機能を使用して分類器を構築することです。OpenCV には、利用できる優れた機械学習アルゴリズムが既にいくつかあります。

私はこの問題に取り組んだことはありませんが、簡単な Google 検索で Cutzu et. アル。 絵画と写真の見分け方

image-processing - 写真と写真を区別する方法は？

3 に答える 3

Related

Reference