opencv - 画像から行を抽出して OCR にフィードする - Tesseract

Question

私は pycon http://youtu.be/B1d9dpqBDVA?t=15m34sからこの講演を見ていました 15:33 頃、講演者は画像 (領収書) から行を抽出し、それを OCR エンジンに供給して、テキストができるようにすることについて話していますより良い方法で抽出されます。

画像をOCRエンジンに渡す場合も同様の必要があります。しかし、画像から線を抽出するという彼の意図がよくわかりません。画像から線を抽出するために使用できるオープンソースツールにはどのようなものがありますか?

score 5 · Accepted Answer

テキストの傾き角度を検出するために使用される手法を見てみましょう。

グループは、画像上のテキストを分離するために使用される線です(これは興味深い部分です)。

この結果から、テキストの各行の上限/下限を簡単に検出できます。テキスト自体はそれらの中に配置されます。私は以前に同様の問題に直面したことがあります.コードはあなたに役立つかもしれません:

ここから行う必要があるのは、行の各ペアを切り取り、それをイメージとして Tesseract にフィードすることだけです。

score 0 · Accepted Answer

画像をOCRにフィードする簡単なテクニックを教えてください..いくつかの操作を実行して、画像のROI（関心領域）を取得し、画像を2値化した後に画像の領域をローカライズします..次に、輪郭を見つけることができます。しきい値を維持し、必要な輪郭領域を設定することにより、結果の画像をOCRにフィードできます:) ..（説明が悪くてすみません）

score 0 · Accepted Answer

直接的な答え: ハフ変換を使用して画像から線を抽出します。ここで分析ガイドを見つけることができます。テキスト行も検出できます。Karlphillip の答えは、Hough Transform にも基づいています。

ここに画像の説明を入力

opencv - 画像から行を抽出して OCR にフィードする - Tesseract

3 に答える 3

Related

Reference