10

私はこの画像を持っています:

代替テキスト

Pythonを使って文字列に読みたいのですが、それほど難しいとは思いませんでした。私はtesseractに出くわし、次にtesseractを使用したPythonスクリプトのラッパーに出くわしました。

それで私は画像を読み始めました、そして私がこれを読もうとするまでそれは素晴らしいことをしました。その特定のフォントを読み取るためにトレーニングする必要がありますか?その特定のフォントが何であるかについてのアイデアはありますか?または、この仕事を成し遂げるためにPythonで使用できるより良いocrエンジンはありますか?

編集:おそらく、数字の周りにある種のベクトルを作成してから、それらをより大きなサイズで再描画することができますか?画像が大きいほど、tesseract ocrがそれらを読みやすくなります(驚くことではありません)。

4

5 に答える 5

11

エンジンを10桁と「。」でトレーニングするだけです。。それはそれをする必要があります。また、OCRを実行する前に、必ず画像をグレースケールに変更してください。

于 2009-11-19T14:51:37.147 に答える
5

トレーニングは難しく、ここで本当に必要なものではありません。スクリプトに関係なく、Oと0およびlと1の区別は難しくなります。OCRを数字の数字からのみ選択するように制限すると、コンテキストで許可されている場合、問題が大幅に単純化されます。

私が正八胞体に興味を持っているのは、古い政府の報告から、たくさんの数字を処理することです。この場合、および問題のケースでは、文字セットは「0123456789」のようになります。2007-03-21のeric_tajによるtesseractの古い(sourceforge)ニュースグループのコメントに続いて、classify /intproto.cppのTemplates->IndexForおよびTemplates->ClassIdForを変更して、許可されない文字をマスクすることができます。 。そのアプローチを少し変更して、実行時に環境変数で許可された文字セットを読み込み、許可されたセットをその場で調整できるようにしました。

于 2010-04-27T04:23:54.203 に答える
1

最近、 tesseract OCRディスカッショングループで、このトピックに関する多くのトラフィックがありました。数字だけの「言語」を使用する必要があります。多くの人が以前にそのようにエンジンを訓練しました。キャプチャデータ保護スキームを無効にしようとしているようです...tsk、tsk。

于 2009-11-19T15:55:05.837 に答える
0

それはEurostileフォントのように見えます。はい、ソース画像で使用されているそれぞれの異なるフォントでトレーニングする必要があります。

于 2009-11-19T11:34:06.500 に答える
0

紙からスキャンした大きく滑らかなフォントを読み取るために最適化された汎用OCRの場合、小さい画面のフォントを認識するのは難しい場合があります。

TextractSDKのような特別なスクリーンショットOCRを試してみてください 。すべてのローカルフォントを収集し、文字を文字に一致させるだけで100%正確な認識を提供します。

于 2013-09-06T02:48:29.887 に答える