9

私はOpenCVのletter_regcogの例を使用しています。これは、次のような構造を持つUCIのデータセットを使用しています。

属性情報:
     1. lettr大文字(AからZまでの26の値)
     2.ボックスのx-box水平位置(整数)
     3.ボックスのyボックス垂直位置(整数)
     4.ボックスの幅幅(整数)
     5.ボックスの高さが高い(整数)
     6. onpix total#on pixel(integer)
     7. x-barは、ボックス内のピクセルのxを意味します(整数)
     8. yバーはボックス内のピクセルのyを意味します(整数)
     9. x2bar平均x分散(整数)
    10. y2bar平均y分散(整数)
    11. xybar平均xy相関(整数)
    12. x * x * yのx2ybr平均(整数)
    13. x * y * yのxy2br平均(整数)
    14. x-ege平均エッジカウント左から右(整数)
    15. x-egeとy(整数)のxegvy相関
    16. y-ege平均エッジカウント下から上(整数)
    17. y-egeとx(整数)のyegvx相関

例:

T、2、8、3、5、1、8、13、0、6、6、10、8、0、8、0、8
I、5、12、3、7、2、10、5、5、4、13、3、9、2、8、4、10

文字の画像をセグメント化して、このようなデータに変換して認識させたいのですが、「6。onpix total#onpixels」のようなすべての値の平均がわかりません。どういう意味ですか?これらの値の平均を教えてください。ありがとう。

4

2 に答える 2

5

私はOpenCVのletter_recogの例に精通していませんが、これは特徴ベクトル、または文字の将来の出現を分類するために使用される文字の画像に関する統計のセットのようです。セグメンテーションの結果は、文字に1があり、それ以外の場所には0があるバイナリマスクが残るはずです。onpixは、文字に含まれるピクセルの総数、つまり、バイナリマスクの合計です。

リストの残りの値のほとんどは、バイナリマスクの値が1のピクセルのセットに基づいて計算する必要があります。xとyはピクセルの位置です。たとえば、xバーは、マスクに1が含まれるすべてのピクセルのすべてのx位置のサンプル平均にすぎません。平均、分散、共分散、相関の数学的定義については、Web上で簡単に参照を見つけることができるはずです。

14〜17は、エッジピクセルに基づいているため少し異なりますが、計算は、ピクセルのセットが異なるだけで、同様である必要があります。

于 2009-08-13T13:15:20.310 に答える
4

私の名前はアントニオ・ベルナルです。この記事の3ページには、各値の適切な説明があります。 Hollandスタイルの適応分類子を使用した文字認識

疑問がある場合はお知らせください。このアルゴリズムを機能させようとしていますが、問題は、値を0〜15の範囲に合わせる方法がわからないことです。これを行う方法を知っていますか?

Googleの学者からの別のリンク->オランダスタイルの適応分類子を使用した文字認識

于 2009-08-26T11:23:57.480 に答える