android - Android Tesseract & レプトニカ OCR。個々のボックスと文字を読み取る

Question

私は Android で Tesseract を使用しています。画像から読み取った文字列とボックスを抽出する次のコードがあります。

TessBaseAPI baseApi = new TessBaseAPI();
baseApi.init(tess_path, "eng"); 
baseApi.setImage(bitmap);
String recognizedText = baseApi.getUTF8Text();
ArrayList<Rect> boxes = baseApi.getCharacters().getBoxRects();
Pixa pixa = baseApi.getCharacters();
baseApi.end();

ここでは、各文字のテキストとボックスが表示されますが、テキストのサイズがボックス配列と異なる場合があり、読み取った文字でボックスを設定することはできません。

正確なボックスとその文字を取得する方法はありますか?

score 3 · Accepted Answer

の代わりにResultIteratorを使用してくださいgetCharacters()：

// Iterate through the results.
final ResultIterator iterator = baseApi.getResultIterator();
String lastUTF8Text;
float lastConfidence;
int count = 0;
iterator.begin();
do {
    lastUTF8Text = iterator.getUTF8Text(PageIteratorLevel.RIL_WORD);
    lastConfidence = iterator.confidence(PageIteratorLevel.RIL_WORD);
    count++;
} while (iterator.next(PageIteratorLevel.RIL_WORD));

android - Android Tesseract & レプトニカ OCR。個々のボックスと文字を読み取る

1 に答える 1

Related

Reference