tesseract で GetHOCRText(0) メソッドを使用すると、html でテキストを取得でき、webview で html を表示するとテキストを取得できますが、画像内のテキストの位置は出力とは異なります。どのアイデアも非常に役立ちます。
tesseract->SetInputName("word");
tesseract->SetOutputName("xyz");
tesseract->Recognize(NULL);
char *utf8Text=tesseract->GetHOCRText(0);
と出力画像