2

ctypesを使用およびtesseract 3.0.2参照して、スニペットを作成します。

import ctypes
from PIL import Image


libname = '/opt/tesseract/lib/libtesseract.so.3.0.2'
tesseract = ctypes.cdll.LoadLibrary(libname)
api = tesseract.TessBaseAPICreate()

rc = tesseract.TessBaseAPIInit3(api, "", 'eng')
filename = '/opt/ddl.ddl.exp654.png'

text_out = tesseract.TessBaseAPIProcessPages(api, filename, None, 0)
result_text = ctypes.string_at(text_out)
print result_text

ファイル名をパラメーターとして渡します。次のような生データを渡すためにAPIでどのメソッドを呼び出すかわかりません。

tesseract.TessBaseAPIWhichMethod(api, open(filename).read())
4

1 に答える 1

0

確かなことは言えませんが、複雑な python オブジェクトをその特定の API に渡すことはできないと思います。それらを処理する方法がわかりません。あなたの最善の策は、ファイルバッファを使用できるようにするhttp://code.google.com/p/python-tesseract/のようなラッパーを見ることです

import tesseract
api = tesseract.TessBaseAPI()
api.Init(".","eng",tesseract.OEM_DEFAULT)
api.SetVariable("tessedit_char_whitelist", "0123456789abcdefghijklmnopqrstuvwxyz")
api.SetPageSegMode(tesseract.PSM_AUTO)

mImgFile = "eurotext.jpg"
mBuffer=open(mImgFile,"rb").read()
result = tesseract.ProcessPagesBuffer(mBuffer,len(mBuffer),api) #YAY for buffers.
print "result(ProcessPagesBuffer)=",result

編集

http://code.google.com/p/python-tesseract/source/browse/python-tesseract-0.7.4/debian/python-tesseract/usr/share/pyshared/tesseract.pyは、次の洞察を提供する可能性がありますあなたが必要です。

...

交換したときに何が起こるか気にしない場合は、実際に

text_out = tesseract.TessBaseAPIProcessPages(api, filename, None, 0)

text_out = tesseract.ProcessPagesBuffer(mBuffer,len(mBuffer),api)
于 2012-10-31T04:31:46.080 に答える