1

レシートをスキャンしてスキャンしたファイルに出力する Python スクリプトがあります。新しいファイルで、tesseract imagefile outputfile を使用します。読みやすいテキストを取得できますが、解析は次のように表示されます。tesseractを使って購入した商品を価格の横に並べる方法はありますか? 私の好みは、PHP または Python で行うことです。

WHELE
POODS .4
M

Merchant Name and Address

365 BHCON LS

365 BHCON LS

365 BHCON LS

365 BHCON LS
BROTH CHIC

FLOUR HLHONO

CHKN BRST BNLSS SK
HEAVY CREHH

BHLSHC REOUCT

BEEF GRND 85/1§«
JUICE COF CHSHEU C

i . DOCS PINT ORGRNIC

NP 4.99
NP 4.99
NP 4.99
NP 4.99
NP 2.19
NRuqfl1.99
NP 18.80
NP 3.39
NP §.49
NP ’.04
NP ‘f:,99
NP 14.49

HNY HLMONO BUTTER NP 9.99

**** TEX .00 BRL
4

1 に答える 1

1

-psm 引数を使用してみてください。その他のアイデアについては、wiki[1] を参照してください。

[1] https://github.com/tesseract-ocr/tesseract/wiki/ImproveQuality

于 2015-12-20T11:28:19.523 に答える