私の質問は、OCR を使用して画像内のテーブルからデータを抽出することに関するこの投稿に続きます。
tesseract
テーブル画像をテキストに変換するために使用しています。これは、テーブルの形式が保持されないことを除けば、うまく機能します。解決策の 1 つは、列をいくつかの文字で置き換えて、tesseract
それをだましてテーブルをテキストとして認識させることです。
次のコードを使用して、「QQ」の列を描画します
im=Image.open("file.png")
draw = ImageDraw.Draw(im)
font=ImageFont.truetype("/usr/share/fonts/gnu-free/FreeSerifBold.ttf",12)
by = font.getsize("S")[1]
col = [240,480]
px = []
for y in range(0,im.size[1],by):
for x in col:
draw.text((x,y),"QQ",font=font,fill=0)
im.save("res-file.png")
im.show()
問題は、tesseract が QQ を認識していることです。空白のページにもQQ列を書きますが、tesseractはそれを認識しませんでした。
tesseract を使用して、このテーブルを png 形式のテキストに変換する方法はありますか? 私を逃したものはありますか?