2

多くの論文は、画像がmxm行列のブロックに分割された後、テキスト領域がグレーレベルのピクセル値から計算された高い固有値を生じさせると述べています。また、その固有値は、画像のテクスチャの「粗さ」の尺度です。

それはテキストの取得とどのように関連していますか?テキスト領域は通常、背景と前景の2色で、均一な色の文字ストロークが使用されます。この粗さはどこにありますか?より粗く、高い固有値をトリガーする他の多くの機能が存在する可能性があります。誰かがこれらのものをつなぐ数学をどこで手に入れるかを指摘できますか?

編集: 自然なシーンでのテキスト検出のコンテキストで固有値に言及するいくつかの論文が含まれています。

  1. テキストのリアルタイム検出と追跡に向けたフレームワークは、グレースケール画像でEigentransformを使用します。

  2. ビデオでのテキスト検出への固有値ベースのアプローチは、勾配画像の共分散行列から固有値を計算することに言及しています。

4

1 に答える 1

1

オリエンテーションだけなので、読み始めて、最終的に次の質問をより的確にターゲットにすることができます。

あなたは主成分分析について話している

ここにサンプルアプリケーションがあります:

ここに画像の説明を入力してください

始めるためのHTH。

于 2011-04-19T21:53:03.907 に答える