1

Python 2.6.6 を実行していて、 pytesseractパッケージをインストールしたいと考えています。解凍してインストールしたら、コマンド ラインから pytesseract を呼び出すことができます。ただし、python 内で tesseract を実行したいと考えています。次のコード (ocr.py) があります。

try:
     import Image
except ImportError:
     from PIL import Image
import pytesseract
print(pytesseract.image_to_string(Image.open('test.png')))
print(pytesseract.image_to_string(Image.open('test-european.jpg'),lang='fra'))

python ocr.py でコードを実行すると、次の出力が得られます。

Traceback (most recent call last):
  File "ocr.py", line 6, in <module>
    print(pytesseract.image_to_string(Image.open('test.png')))
  File "/pytesseract-0.1.6/build/lib/pytesseract/pytesseract.py", line 164, in image_to_string
    raise TesseractError(status, errors)
pytesseract.TesseractError: (2, 'Usage: python tesseract.py [-l language] input_file')

test.png と test-european.jpg は作業ディレクトリにあります。このコードの実行を手伝ってくれる人はいますか? 私は次のことを試しました:

  1. tesseract_cmd を「pytesseract」に調整しました
  2. インストールされたtesseract-ocr

私は今、この問題を何時間も解決しようとしているので、助けていただければ幸いです。

4

1 に答える 1

2

tesseract_cmdtesseractではなく、コマンド ライン プログラムを指す必要がありpytesseractます。

たとえば、Ubuntu では、次を使用してプログラムをインストールできます。

sudo apt install tesseract-ocr

そして、変数を単にtesseractorに設定します/usr/bin/tesseract

于 2016-10-19T13:29:28.260 に答える