c# - Tesseract (tessnet2) は単純な数値を読み取ることができません

翻译自：https://stackoverflow.com/questions/46058283 2017-09-05T15:11:18.003

534 次

画像からテキストを抽出するための簡単なコードを設計しました。画像には数字のみが含まれています。これは私が変換したい画像です：

OCR 変換の結果は常に ~

この 2 つの画像では、OCR 変換の結果にいくつかの誤りがあります。

これが私のコードです：

    using Tes = tessnet2;

    private const string TesIni = @"C:\Program Files (x86)\Tesseract\tessdata";

    static void Main(string[] args)
    {
        System.Drawing.Bitmap TextImg = new System.Drawing.Bitmap(@"C:\HomeC\RPA_Prozesse\BOB_NPM_Retour\btnImages\TestTextImage.png");
        Tes.Tesseract ocr = new Tes.Tesseract();
        ocr.Init(TesIni, "eng", true);
        System.Collections.Generic.List<Tes.Word> Result = ocr.DoOCR(TextImg, System.Drawing.Rectangle.Empty);
        foreach(Tes.Word wrd in Result)
        {
            System.Console.WriteLine(wrd.Text);
        }

        System.Console.WriteLine("Application finished. Press any key to exit...");
        System.Console.ReadLine();
    }

ドキュメントには、「Tesseract」は最高のオープンソース OCR ライブラリであり、Google によってほとんど改善されていないと書かれていますが、結果は非常に貧弱です。

より良い結果を得るために変更できる設定はありますか?

c# - Tesseract (tessnet2) は単純な数値を読み取ることができません

0 に答える 0

Related

Reference