1

pytesser (python 用の tesseract-ocr を備えた画像処理ライブラリ) を使用して実行すると:

image= Image.open(ImagePath)
text = image_to_string(image)
print text

その結果text、 と tesseract から次の行を取得します。

Tesseract Open Source OCR Engine v3.02 with Leptonica

image_to_string関数が実行されると、この行が実行されると思います。

これは、コンソールに表示される出力を実際に詰まらせます。そして本当に迷惑です。誰かがそれを取り除く方法を知っていますか? 多分pythonの行か何か?

4

4 に答える 4

1

あなたがすることはpytesser.py、メインpytesserフォルダーで開き、この関数を変更することです:

def call_tesseract(input_filename, output_filename):
    """Calls external tesseract.exe on input file (restrictions on types),
    outputting output_filename+'txt'"""
    args = [tesseract_exe_name, input_filename, output_filename]
    proc = subprocess.Popen(args)
    retcode = proc.wait()
    if retcode!=0:
        errors.check_for_errors()

def call_tesseract(input_filename, output_filename):
    """Calls external tesseract.exe on input file (restrictions on types),
    outputting output_filename+'txt'"""
    devnull = open(os.devnull, 'w')
    args = [tesseract_exe_name, input_filename, output_filename]
    proc = subprocess.Popen(args, stderr=devnull)
    retcode = proc.wait()
    if retcode!=0:
        errors.check_for_errors()

import osまた、ファイルの先頭に 追加します。

于 2014-07-28T14:39:09.120 に答える