1

論文を読んで、説明されているアルゴリズムを理解するのに苦労しています:

手書きサンプルの白黒デジタル画像が与えられた場合、1 文字を切り取って分析します。これは任意のサイズになる可能性があるため、アルゴリズムはこれを考慮する必要があります (より簡単な場合は、サイズが 2^nx 2^m であると想定できます)。

ここで、説明では、この画像を指定して、次のように 512 ビットの機能 (512 ビットのハッシュ) に変換すると述べています。

  1. (192 ビット) は、3x3 のソーベル演算子で畳み込むことにより、画像の勾配を計算します。各エッジのグラデーションの方向は 12 方向に量子化されます。

  2. (192 ビット) 構造的特徴ジェネレーターは勾配マップを取得し、近傍で勾配値の特定の組み合わせを探します。(画像の線と角を表す 8 つの異なる特徴を計算するために使用されます)

  3. (128 ビット) 凹みジェネレーターは、8 ポイント スター演算子を使用して、4 方向の粗い凹み、穴、およびラグスケール ストロークを検出します。

画像の特徴マップは、4x4 グリッドで正規化されています。

私は今のところ、任意の画像を取得し、16 のセクションに分割し、3x3 ソーベル演算子を使用して各セクションに 12 ビットを作成する方法に苦労しています。(ただし、他の部分についての洞察がある場合は、お気軽にコメントしてください:)

4

2 に答える 2

3

私はSrihariらによる同じ論文に苦労しています。(2002)私の博士号のために。論文。このテキストはあまり具体的ではないと思いますが、詳細については、著者はテクニカル レポート (CEDAR-TR-01-1) を参照しています。このレポートはインターネット上ではアクセスできないようです。そのため、著者に電子メールで連絡して、このレポートを依頼することをお勧めします。不明な点がある場合は、説明を求めることもできます。

于 2009-11-03T11:56:01.390 に答える
2

質問は非常に古いですが、誰かを助けることができるかもしれません-画像の水平方向および垂直方向のエッジ検出にソーベル演算子を適用します。この結果から、画像のすべてのポイントの画像方向ベクトルを計算できます。あなたの場合、これらのベクトルを 12 方向にマッピングする必要があります。次に、あなたの場合、画像を 4x4 サブ画像 (16 セクション) に分割し、各セクションの各方向の強度を計算します。これにより、12*16=192 個の機能が得られます。必要に応じて、より詳細な説明を行うことができます。

于 2014-07-18T12:45:50.907 に答える