問題タブ [tesseract]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - PythonTesseractはこのフォントを認識できません
私はこの画像を持っています:
Pythonを使って文字列に読みたいのですが、それほど難しいとは思いませんでした。私はtesseractに出くわし、次にtesseractを使用したPythonスクリプトのラッパーに出くわしました。
それで私は画像を読み始めました、そして私がこれを読もうとするまでそれは素晴らしいことをしました。その特定のフォントを読み取るためにトレーニングする必要がありますか?その特定のフォントが何であるかについてのアイデアはありますか?または、この仕事を成し遂げるためにPythonで使用できるより良いocrエンジンはありますか?
編集:おそらく、数字の周りにある種のベクトルを作成してから、それらをより大きなサイズで再描画することができますか?画像が大きいほど、tesseract ocrがそれらを読みやすくなります(驚くことではありません)。
c# - C# の Tesseract OCR
重複の可能性:
Tesseract インターフェースを使用した OCR
C# で実行されている tesseract ocr エンジンのサンプル プロジェクトまたはコンパイル済みの dll を誰かが持っているかどうか疑問に思っていますか? tessnet2 デモ (ここ) を試してみましたが、何らかの理由で、現在の VS2008 インストールに C++ のものをインストールできないため、ビルドできません。
ありがとう!
ocr - Linux 上の OCRopus/Tesseract による Fraktur 認識
ocropus で fraktur 書体のドイツ語テキストの認識を実行しようとしていますが、deu-f パッケージを使用していないようです。
これが私が実行した手順です。
- tesseract と ocropus をコンパイルしてインストールしました。
- http://tesseract-ocr.googlecode.com/files/tesseract-2.01.deu-f.tar.gzをダウンロードし、tessdata/ に解凍しました。
でも電話したら
p>結果は私が呼び出したときと同じです
p>問題は何ですか?
iphone - Iphone の Tesseract の例
次のxcodeで使用するためにtesseractをコンパイルしました:http://iphone.olipion.com/cross-compilation/tesseract-ocr
.a ファイルを取得し、それをフレームワークとして iphone プロジェクトにインポートし、tesseract ヘッダー ファイルのヘッダー検索パスを更新します。
ですから、始めるには簡単な例が必要です。http://code.google.com/p/tesseract-ocr/ またはグーグルで何も見つかりません。
誰でも私に出発点(コードスニペット)を教えてくれます..?! どうもありがとう!
-- 後でこのコードを見つけました:
#include "baseapi.h"
TessBaseAPI::InitWithLanguage(NULL, NULL, language, NULL, false, 0, NULL);
char* text = TessBaseAPI::TesseractRect(imagedata, bytes_per_pixel,
bytes_per_line, 0, 0,
width, height);
TessBaseAPI::End();
しかし、デバイス用にコンパイルしようとすると (上記のコードなしで include ステートメントを挿入するだけです)、次のようになります:
エラー: 'PAGE_RES' 警告の前の構文エラー: 'PAGE_RES' の宣言では、型のデフォルトは 'int' です 警告: データ定義に型またはストレージ クラスがありません
BLOCK_LIST、IMAGE などと同様です。
シミュレーター用にコンパイルすると、
エラー: 'PAGE_RES' の前に'=',',',','asm' または ' attribute ' が必要です
--- その他の更新: インクルードの問題の解決策を見つけました: インクルードが発生する場所では、.mm 拡張子の file.m の名前を変更する必要があります。
ocr - tesseractが探している文字を制限する
tesseractが検索する文字のセットを制限することは可能ですか(たとえば、文字azのみを検索する)?それは私の結果を大いに改善するでしょう。
ocr - OCR と単語のレビュー
私は文字認識プロジェクトに Tesseract を使用していますが、現在、認識は非常に良好です。画像処理部分は、OpenCv ライブラリを使用して行われました。文字は手書きですが、文字の「O」と数字の「0」を認識するのに少し問題がありました。これらの文字は、名前を入力するフィールドとしてデータ領域で使用されます。したがって、名前に数字を含めることはできません。また、生年月日としてデータ フィールドのシステムを使用している場合、数字のみが含まれます。そのため、対応するデータ フィールドが数字または文字のみであると言って、認識システムに制限を加えても構わないと思っています。
また、データの精度を向上させるために、認識された文字と可能な単語を確認したいと考えています。このタスクには openCv ライブラリを使用したいと考えています。しかし、このタスクに役立つライブラリとその機能が何であるかはわかりません。誰かが私を助けてください。ありがとうございました。
よろしく、ティランカ。
python - OCRを介してTシャツの写真からコードを抽出する
私は最近、裏面にPerlコードが付いたTシャツを着ている人を見ました。私はそれの写真を撮り、コードを切り取りました:
次に、OCRを介して画像からコードを抽出しようとしたので、TesseractOCRとそのPythonバインディングであるpytesserをインストールしました。
PytesserはTIFF画像でのみ機能するため、Gimpで画像を変換し、次のコード(Ubuntu 9.10)を入力しました。
これは、OCRエンジンから出てくる明らかにぎこちないものです。だから、私の質問は:
- Tesseractからより良いOCR結果を得るには、何をする必要がありますか?
- または、他の誰かが別の方法で上の画像からコードを抽出するより幸運がありますか?
c# - C# の Tesseract.NET
http://www.pixel-technology.com/freeware/tessnet2/でビンとdllを使用する方法のステップバイステップガイドを知っていますか
サイトからダウンロードしたzipファイルに存在しないdllをコンパイルするときに、これを使用しようとして2日間費やしました。
どんな助けでも大歓迎です。
bitmap - OCR:精度を向上させる方法 - テキスト以外の「家具」や形状などを削除してOCRの混乱を避けるための既存のライブラリ?
スクリーンショット画像でテキストを囲む四角形などを削除して、光学式文字認識を実行してスクリーンショットから正確なテキストを取得できるようにします。
バックグラウンド:
他のアプリケーションで使用するためにレガシー アプリケーションからデータを抽出するためにこれを行っています。関連ファイルはクローズドで独自のバイナリ形式であるため、これがこのデータを取得する唯一の方法です。
AutoItScript を使用してアプリケーションを駆動し、UI にデータを表示します。次に、これをスクリーンショットして、tesseract にフィードします。
私はすでにUIの自動化にある程度成功しており、tesseractを使用してビットマップからプレーンASCIIテキストを取得することができました。
tesseract/OCR での使用について議論している AutoItScripr フォーラムの記事がいくつかありますが、特に私の質問ではありません。 http://www.autoitscript.com/forum/index.php?s=6c32c3ece12756e635a619cdf175eff9&showforum=2
私は何をする必要がありますか
一部のテキストを密接に囲む幅が 1 ピクセルの細い四角形があります。tesseract に入力すると、たとえば四角形の垂直線として I として認識されます。
四角形を削除する方法やベストプラクティスについて何か考えはありますか?
たとえば、.png ファイルで四角形を上書きするための汎用コマンド ライン ベースのツールセットがあるかどうかを尋ねています。次に、これを介して .png を渡し、tesseract に渡します。
私が使用したtesseractリリース/セットアップの詳細は次のとおりです。
ここにアクセスしてください: http://code.google.com/p/tesseract-ocr/downloads/list - Tesseract を起動して実行し、ビットマップ化されたテキストを ascii テキストに認識するための基本的な英語の汎用文字セットについては、tesseract-2.00 を使用します。 eng.tar.gz (執筆時点での最新バージョン: 「Tesseract の英語データ (2.00 以降) 2007 年 7 月 989 KB 84845」)
スタック オーバーフローで既に見た関連する質問
これらでは、私の質問に対する完全な回答が得られていないか、商用ソリューションが販売されています。この段階では商用ソリューションを検討したくありません。