「ドキュメント」からの画像から水平線と垂直線を見つけようとしています。ドキュメントは契約書からスキャンされたページであるため、行は表や契約書ブロックに表示されるものと同じように見えます。
私は仕事のためにOpenCVを試してきました。OpenCV でのハフ変換の実装は、この仕事に役立つように見えましたが、垂直線と水平線をきれいに見つけることができるパラメーターの組み合わせを見つけることができませんでした。エッジ検出ありとなしで試してみました。運がない。誰かが似たようなことをしたことがあるなら、その方法を知りたいです。
OpenCV での HoughP の実験前後の画像を参照してください。それは私ができる最善のことです、http://dl.dropbox.com/u/3787481/Untitled%201.png
だから今、水平線と垂直線(できれば破線も)を確実に見つけることができる別の種類の変換があるかどうか疑問に思っています。
Nuance と ABBYY OCR ツールを使用しているため、この問題は解決可能であることがわかります。これらのツールは、水平線と垂直線の両方を確実に抽出し、線の境界ボックスを返すことができます。
ありがとう!パトリック。