問題タブ [ocr]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - 画面外の文字を読む
私はかなり長い間、自分の問題の解決策を見つけようとしてきました。画面からデータを読み取り、文字と画像を認識し、文字と画像に基づいて動作するプログラムを作成する必要があります。たとえば、犬の写真、可能な各キャラクターの写真を提供すると、画面を読み取って、犬がどこにいたか、キャラクターがどこにいて、どのような順序でいたかなどを教えてくれます。これのための無料のライブラリはどこかにありますか?C# または Vb.net で使用できるものを好む
java - Android用OCRアプリケーション
私は、Android 携帯電話で英語のテキストに対して OCR を実行するアプリケーションを開発するプロジェクトに取り組んでいます。
既存のオープン ソース OCR エンジンを使用したいと考えています。たとえばtesseractのように。
誰でも私を助けてもらえますか?私を正しい方向に向けますか?これは私の初めてのプロジェクトです。
image-processing - より良いOCR結果を得るためのこの分析に基づく画像の分析と変換
私はOCRプロジェクトを持っていますが、テキストが逆さまではなく、かなりまっすぐな画像でのみうまく機能します。(テキストを回転させないで)それで、OCRが逆さまでもどんな種類の画像でも認識できるようにしたいと思います。しかし、私はこの問題を解決するためのアプローチが何であるかわかりません。
文字の線の分析のようなものが必要ですが、それでも線が逆さまになっているかどうかを識別できません。
ocr - ビットマップ フォント ファイル内の各グリフのラベル付き画像の生成
特定のビットマップ フォント ファイルに含まれる各グリフのラベル付きビットマップ イメージを生成する簡単な方法はありますか?
日本語の .bdf フォントのコレクションを MATLAB および C++ で使用可能な形式に変換しようとしています。各グリフは、それが表す文字の OCR 分類キーとして使用されます。
perl - この特定のPerlの問題を解決するために他にどのような診断方法を使用できますか?
多くの実験を行った後でも、次のスクリプトを機能させることができません。この特定のPerlの問題を診断する方法についてのガイダンスが必要です。前もって感謝します。
このスクリプトは、Office 2007OCRAPIの使用をテストするためのものです。
私は小さなテストをしました。OCR情報を含む.MDIファイルをロードしました。OCRメソッドの行を削除してスクリプトを実行すると、「print$OCRresult」という期待されるテキスト出力が得られました。しかしそうでなければ、Perlは私に次のようなエラーをスローします
回線に問題があるのではないかと疑っています
私は、parensを空のままにするか、'miLANG_ENGLISH'、1,1などの3つの装飾を使用してみましたが、運がありませんでした。また、Microsfot Office Document Imagingを使用して、実験しているTIFがテキストで認識可能であり、結果が陽性であるかどうかをテストしてみました。
では、他にどのような診断方法がありますか?
または、Office 2007を使用している人が、テキストコンテンツを含むjpg、bmp、またはtif画像を使用してコードをテストし、問題がないかどうかを確認できますか?
前もって感謝します。
アップデート
ハハ、私はついに問題がどこにあるのか、そしてどうすればそれを解決できるのかを理解しました。@ hobbs、コメントを残してくれてありがとう:)物事は面白いです。あなたのコメントに返信しようとしたときに、Office Document Imaging 2003 VBA言語リファレンスのURLのリンクを追加し、そこにあるものをもう一度調べました。そして、次の情報が私の目に留まりました。
次のOCRメソッド行を変更しました。
これに:
いくつかの注意事項:1。Windows XP(中国語版)でActivePerl 5.10.0を実行しています。2。この前に、$ miDoc->(9)を試しましたが、運がありませんでした。
そして突然、魔法のように、「初期化されていない値$ OCRを使用するとE:\ OCR-test.plの15行目で印刷されます」という厄介なエラーが完全に消え、OCRedテキストが画面に表示されました。OCRの結果は満足のいくものではありませんでしたが、パラメータ「2052」は中国語を参照しており、TIF画像にはすべて英語が含まれています。そこで、パラメータを$ miDoc-> OCR(9,1,1)に変更しましたが、今回は運がありませんでした。Windowsは私にこのエラーを投げました:
TIF画像をすべての漢字を含む画像に変更し、パラメーターを「$ miDoc-> OCR(2052,1,1);」に変更しました。繰り返しになりますが、今回はすべてが期待どおりに機能しました。OCRの結果は満足のいくものでした。
今、私のOffice 2007 OCR APIには何か奇妙なことがあると思います。たまたま、Windows XP(英語版)を実行していてOffice 2007をインストールした人が、パラメータでその例外エラーに遭遇することはおそらくないでしょう。
とにかく、私はついに物事が機能するようになったことを本当に嬉しく思います:D
ocr - tesseractが探している文字を制限する
tesseractが検索する文字のセットを制限することは可能ですか(たとえば、文字azのみを検索する)?それは私の結果を大いに改善するでしょう。
ocr - OCR と単語のレビュー
私は文字認識プロジェクトに Tesseract を使用していますが、現在、認識は非常に良好です。画像処理部分は、OpenCv ライブラリを使用して行われました。文字は手書きですが、文字の「O」と数字の「0」を認識するのに少し問題がありました。これらの文字は、名前を入力するフィールドとしてデータ領域で使用されます。したがって、名前に数字を含めることはできません。また、生年月日としてデータ フィールドのシステムを使用している場合、数字のみが含まれます。そのため、対応するデータ フィールドが数字または文字のみであると言って、認識システムに制限を加えても構わないと思っています。
また、データの精度を向上させるために、認識された文字と可能な単語を確認したいと考えています。このタスクには openCv ライブラリを使用したいと考えています。しかし、このタスクに役立つライブラリとその機能が何であるかはわかりません。誰かが私を助けてください。ありがとうございました。
よろしく、ティランカ。
java - PDFファイルがスキャンされたものかどうかを確認します
PDFファイルが完全にスキャンされたものであるかどうかをプログラムで確認するための最良の方法は何ですか?私は自由にiTextとPDFBoxを持っています。PDFファイルにテキストが含まれているかどうかを確認し、その結果に基づいてこのファイルがOCRedであるかどうかを判断できますが、このソリューションは100%正確ではありません。この問題に対処する別の方法があるかどうか知りたいのですが。
ご存知のとおり、ソリューションはJavaベースである必要があります。
python - OCRを介してTシャツの写真からコードを抽出する
私は最近、裏面にPerlコードが付いたTシャツを着ている人を見ました。私はそれの写真を撮り、コードを切り取りました:
次に、OCRを介して画像からコードを抽出しようとしたので、TesseractOCRとそのPythonバインディングであるpytesserをインストールしました。
PytesserはTIFF画像でのみ機能するため、Gimpで画像を変換し、次のコード(Ubuntu 9.10)を入力しました。
これは、OCRエンジンから出てくる明らかにぎこちないものです。だから、私の質問は:
- Tesseractからより良いOCR結果を得るには、何をする必要がありますか?
- または、他の誰かが別の方法で上の画像からコードを抽出するより幸運がありますか?