問題タブ [ocr]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
5 に答える
7837 参照

python - PythonTesseractはこのフォントを認識できません

私はこの画像を持っています:

代替テキスト

Pythonを使って文字列に読みたいのですが、それほど難しいとは思いませんでした。私はtesseractに出くわし、次にtesseractを使用したPythonスクリプトのラッパーに出くわしました。

それで私は画像を読み始めました、そして私がこれを読もうとするまでそれは素晴らしいことをしました。その特定のフォントを読み取るためにトレーニングする必要がありますか?その特定のフォントが何であるかについてのアイデアはありますか?または、この仕事を成し遂げるためにPythonで使用できるより良いocrエンジンはありますか?

編集:おそらく、数字の周りにある種のベクトルを作成してから、それらをより大きなサイズで再描画することができますか?画像が大きいほど、tesseract ocrがそれらを読みやすくなります(驚くことではありません)。

0 投票する
1 に答える
5727 参照

c# - C# での優れたオープンソース OCR

C# に優れたオープン ソースの OCR 実装はありますか? 次の問題を解決しようとしています。ボックスを含むドキュメントがあり、ユーザーはボックスに ID 番号を入力します。ここで、プログラム内の ID 番号を把握したいと考えています。

ありがとう、バラ

0 投票する
1 に答える
4682 参照

c# - C# の Tesseract OCR

重複の可能性:
Tesseract インターフェースを使用した OCR

C# で実行されている tesseract ocr エンジンのサンプル プロジェクトまたはコンパイル済みの dll を誰かが持っているかどうか疑問に思っていますか? tessnet2 デモ (ここ) を試してみましたが、何らかの理由で、現在の VS2008 インストールに C++ のものをインストールできないため、ビルドできません。

ありがとう!

0 投票する
5 に答える
211755 参照

java - Java OCR の実装

これは主に単なる好奇心ですが、純粋な Java での OCR 実装はありますか? これが純粋にJavaでどのように機能するのか興味があり、OCRは一般的に興味があるので、私が完全に理解している言語でどのように実装されるかを見てみたい. 当然、これには実装がオープン ソースであることが必要ですが、少なくともその場合のパフォーマンスを確認できるので、独自のソリューションに興味があります。

Java で使用できるもの ( Aspriseなど) をいくつか見てきましたが、これらは純粋な Java 実装ではないようです...何かありますか?

0 投票する
8 に答える
627 参照

c# - 金額文字列を数値に解析する

OCR エンジンを使用して紙の文書を認識するシステムに取り組んでいます。これらのドキュメントは、合計、付加価値税、正味額などの金額を含む請求書です。これらの金額の文字列を数値に解析する必要がありますが、各請求書の数値の小数点と千の区切りにさまざまな記号を使用するさまざまな形式とフレーバーがあります。.NET で通常の double.tryparse および double.parse メソッドを使用しようとすると、通常、一部の量で失敗します。

これらは私が量として受け取る例の一部です

数値の小数点記号と桁区切り記号が何であるかを推測し、ユーザーに値を提示して、これが正しいかどうかを判断する方法が必要です。

この問題をエレガントな方法で解決する方法を考えています。

0 投票する
1 に答える
3765 参照

ocr - Linux 上の OCRopus/Tesseract による Fraktur 認識

ocropus で fraktur 書体のドイツ語テキストの認識を実行しようとしていますが、deu-f パッケージを使用していないようです。

これが私が実行した手順です。

  1. tesseract と ocropus をコンパイルしてインストールしました。
  2. http://tesseract-ocr.googlecode.com/files/tesseract-2.01.deu-f.tar.gzをダウンロードし、tessdata/ に解凍しました。

でも電話したら

p>

結果は私が呼び出したときと同じです

p>

問題は何ですか?

0 投票する
2 に答える
3022 参照

ruby-on-rails - 光学式文字認識で Ruby と Ubuntu を使用する

私は大学生で、また教科書を買う時が来ました。この四半期には、クラスで必要な本が 20 冊以上あります。ISBN をコピーして Amazon に貼り付けるだけなので、通常はそれほど大したことではありません。ただし、ISBN は私の学校の書籍サイトで画像に変換されます。私がやりたいことは、ISBN を文字列に変換することだけなので、1 つずつ手で入力する必要はありません。画像をテキストに変換するために GOCR を使用しましたが、Ruby スクリプトを使用してプロセスを自動化し、クラスメートにも同じことを行いたいと考えています。

サイトに移動できます。イメージを自分のコンピューター (UBUNTU を実行している) のファイルに保存し、GOCR でイメージを変換し、最後にファイルに保存して、Ruby スクリプトで再びアクセスできるようにするにはどうすればよいですか?

0 投票する
7 に答える
10864 参照

ocr - 印刷されたソースコードリストに優れたOCRが必要ですか、アイデアはありますか?

私の仕事では、印刷されたソースコードを取得して、テキストエディタに手動でソースコードを入力する必要がある場合があります。理由を聞かないでください。

明らかに、入力には長い時間がかかり、入力エラーをデバッグするために常に余分な時間がかかります(おっと、そこで「$」記号を見逃しました)。

私は次のようないくつかのOCRソリューションを試すことにしました:

  • MicrosoftDocumentImaging-OCRが組み込まれています
    • 結果:先頭の空白をすべて見逃し、すべての下線を見逃し、句読文字の多くを誤って解釈しました。
    • 結論:手動でコードを入力するよりも時間がかかります。
  • さまざまなオンラインWebOCRアプリ
    • 結果:MicrosoftDocumentImagingと同等またはそれより悪い
    • 結論:手動でコードを入力するよりも時間がかかります。

フォントがサンセリフとモノスペースであることを考えると、ソースコードはOCRするのが非常に簡単だと思います。

ソースコードでうまく機能する優れたOCRソリューションを見つけた人はいますか?

たぶん私はより良いOCRソリューション(必ずしもソースコード固有ではない)が必要ですか?

0 投票する
3 に答える
1925 参照

iphone - オープンソース/無料の OCR (パターン認識) ソフトウェアはありますか? (モバイルプラットフォーム用?)

ユーザーが携帯で拾った画像からテキスト情報(中国語)を抽出したい。だから、モバイルプラットフォーム用のオープンソース/無料のOCR(パターン認識)ソフトウェアがあるのだろうかと思っています。現在、私はiPhoneでやっています(そしてアンドロイド、ブラックベリープラットフォーム?)

stackoverflow を検索しましたが、C#/.Net に関するいくつかの質問しかないようです

よろしくお願いします〜