0

テキストが実際に手書きされている、これに似た表があります。各フィールドが入力されているかどうかを確認できるようにしたいのですが、各フィールドの内容を理解したり認識したりする必要はありません。フィールドが入力されたことを検出できるようにする必要があるだけです。

テーブルの例

人々はスキャナーでページをスキャンする必要があり、プログラムはフィールドを検出し、本質的にコンテンツがあるかどうかを確認する必要があります。誰かがアイデアを持っているか、簡単な解決策を知っていますか? ICR か OCR を使おうと思ったのですが、OCR は手書きのテキストを検出できず、ICR はお金を払ってでも良いのですが、あまりにも良いです。

4

1 に答える 1

0

これは非常に簡単かもしれませんが、状況がどれほど静的かによって異なります。イメージをグレースケール イメージに変換し、しきい値を適用して黒と白を分離します。次に、a や o などの文字に属する小さすぎる白い領域を無視し、残りの領域にクロージングを適用して、単一のテーブル セルを取得する必要があります。これで、各領域の位置で平均グレー値を決定できます。それが特定の値を超えている場合、塗りつぶされたセルが見つかりました。この方法は、セルの白い背景が何らかの形で接続されている場合にのみ機能します。そうでない場合、閉じる操作は期待どおりに機能しません。照明の状況も、固定のしきい値で重要です。

于 2020-06-20T19:44:16.853 に答える