0

.Net で Tesseract OCR エンジンを使用して OCR を実行したいと考えています。したがって、tesseractdotnet-Wrapper 1を使用します。認識された各単語の単語位置を取得する必要があります (RetribResultDetail-Method):

TesseractProcessor ocr = new TesseractProcessor();
ocr.Init(executionPath, "eng", 3);
Image image = Image.FromFile(imagePath);
Console.WriteLine(ocr.Apply(image));
List<tesseract.Word> wordList = ocr.RetriveResultDetail();

null残念ながら、 Apply-Method はコンソールにテキスト結果を表示しますが、wordList は常にです。

4

2 に答える 2

1

調査中に、 を呼び出すApply-method前に を呼び出す必要があることがわかりましたRetriveResultDetail-method。単語リストを呼び出した後、Apply-methodいつでも空ではありません。コードは次のようになります。

TesseractProcessor ocr = new TesseractProcessor();
ocr.Init(executionPath, "eng", 3);
string result = ocr.Apply(bmp);
Image image = Image.FromFile(imagePath);
Console.WriteLine(ocr.Apply(image));
List<tesseract.Word> wordList = ocr.RetriveResultDetail();
于 2013-06-25T12:30:00.930 に答える
0

画像にアルファベットしか含まれていない場合でも、RetriveResultDetail() は常に数字の文字列である単語のリストを返します。

于 2015-06-06T08:17:42.867 に答える