c++ - UCIから「文字画像認識データセット」のような画像からデータを作成する方法

Question

私はOpenCVのletter_regcogの例を使用しています。これは、次のような構造を持つUCIのデータセットを使用しています。

属性情報：
     1. lettr大文字（AからZまでの26の値）
     2.ボックスのx-box水平位置（整数）
     3.ボックスのyボックス垂直位置（整数）
     4.ボックスの幅幅（整数）
     5.ボックスの高さが高い（整数）
     6. onpix total＃on pixel（integer）
     7. x-barは、ボックス内のピクセルのxを意味します（整数）
     8. yバーはボックス内のピクセルのyを意味します（整数）
     9. x2bar平均x分散（整数）
    10. y2bar平均y分散（整数）
    11. xybar平均xy相関（整数）
    12. x * x * yのx2ybr平均（整数）
    13. x * y * yのxy2br平均（整数）
    14. x-ege平均エッジカウント左から右（整数）
    15. x-egeとy（整数）のxegvy相関
    16. y-ege平均エッジカウント下から上（整数）
    17. y-egeとx（整数）のyegvx相関

例：

T、2、8、3、5、1、8、13、0、6、6、10、8、0、8、0、8
I、5、12、3、7、2、10、5、5、4、13、3、9、2、8、4、10

文字の画像をセグメント化して、このようなデータに変換して認識させたいのですが、「6。onpix total＃onpixels」のようなすべての値の平均がわかりません。どういう意味ですか？これらの値の平均を教えてください。ありがとう。

score 5 · Accepted Answer

私はOpenCVのletter_recogの例に精通していませんが、これは特徴ベクトル、または文字の将来の出現を分類するために使用される文字の画像に関する統計のセットのようです。セグメンテーションの結果は、文字に1があり、それ以外の場所には0があるバイナリマスクが残るはずです。onpixは、文字に含まれるピクセルの総数、つまり、バイナリマスクの合計です。

リストの残りの値のほとんどは、バイナリマスクの値が1のピクセルのセットに基づいて計算する必要があります。xとyはピクセルの位置です。たとえば、xバーは、マスクに1が含まれるすべてのピクセルのすべてのx位置のサンプル平均にすぎません。平均、分散、共分散、相関の数学的定義については、Web上で簡単に参照を見つけることができるはずです。

14〜17は、エッジピクセルに基づいているため少し異なりますが、計算は、ピクセルのセットが異なるだけで、同様である必要があります。

score 4 · Accepted Answer

私の名前はアントニオ・ベルナルです。この記事の3ページには、各値の適切な説明があります。 Hollandスタイルの適応分類子を使用した文字認識。

疑問がある場合はお知らせください。このアルゴリズムを機能させようとしていますが、問題は、値を0〜15の範囲に合わせる方法がわからないことです。これを行う方法を知っていますか？

Googleの学者からの別のリンク->オランダスタイルの適応分類子を使用した文字認識

c++ - UCIから「文字画像認識データセット」のような画像からデータを作成する方法

2 に答える 2

Related

Reference