問題タブ [tesseract]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
752 参照

html - Tesseract-Job:画像から情報を取得するために画像を解析する方法

おはようございます。

初めに。これは私が今まで見た中で最も印象的なコミュニティです!

さて数日私はの三つ折りの仕事について考えました

a。取得b。解析c。ページ数を保存します。

2日前、私はページを取得することが主要なタスクになるだろうと思いました。いいえ、そうではありません-パーサージョブは英雄的な仕事になると思います。解析対象の各ページはpng画像です。

したがって、問題は、すべてを取得した後です。それらを解析する方法!?これが問題のようです。そこにいくつかのperlモジュールがあると思います-これを行うのに役立ちます...

ええと、この仕事はいくつかのOCRが埋​​め込まれている場合にのみ実行できると思います!質問:このタスクをサポートするためにここで使用できるperlモジュールはありますか?

ところで:結果ページを参照してください。

画像を見る

ところで;:そして私が思ったように、私はId=0とId=100000の間の特定の範囲内で、790の結果ページすべてを見つけることができると思いました。

http://www.foundationfinder.ch/ShowDetails.php?Id=11233&InterfaceLanguage3%Type=Html http://www.foundationfinder.ch/ShowDetails.php?Id=927&InterfaceLanguage=1&Type=Html http://www.foundationfinder。 ch / ShowDetails.php?Id = 949&InterfaceLanguage = 1&Type = Html http://www.foundationfinder.ch/ShowDetails.php?Id=20011&InterfaceLanguage=1&Type=Html http://www.foundationfinder.ch/ShowDetails.php?Id= 10579&InterfaceLanguage = 1&Type = Html

私はPerl-Wayに行くことができると思いましたが、よくわかりません。同じURL[以下を参照]で異なるクエリ引数を使用してLWP:: UserAgentを使用しようとしていたのですが、LWP::UserAgentがクエリ引数をループする方法はありますか?LWP::UserAgentにそれを行うためのメソッドがあるかどうかはわかりません。えーと、Mechanizeの方が使いやすいと時々聞いたことがあります。しかし、それは本当に簡単ですか!?

しかし-率直に言って; 最初のタスク「すべてのページを取得することはそれほど難しくありません-このタスクを解析と比較すると...これはどのように行うことができますか!?

任意のアイデア-提案-

あなたから聞くことを楽しみにしています...

0 投票する
3 に答える
21607 参照

c++ - Tesseract - 言語ファイルの場所を変更する

OCR機能が必要なAIRプロジェクトを作成しているので、tesseractを使用することにしました(現在、Windowsで動作させようとしています)。

私の問題は、言語ファイルの場所を変更できないことです-常にTesseractインストールディレクトリ(プログラムファイル(x86)\ Tesseract-OCR\tessdata\mylang.traineddata)を調べようとします

指定した場所でこのファイルを探すように Tesseract を構成する方法はありますか? たとえば、tesseract.exe と同じフォルダーにあります。AIR インストーラーを使用してアプリケーションをインストールしたくありません (またはできません)。3.0版と最新のSVN版で試してみました。

ありがとう

0 投票する
1 に答える
597 参照

perl - このモジュールの問題 Image::OCR::Tesseract

activestate perl v5.8.8 がインストールされています。次のモジュール Image::OCR::Tesseract を ppm でインストールします。

次のコードを実行しようとすると:

以下のエラー メッセージが表示されます。

無効なパラメータ - -compress

1024 at C:/Perl/site/lib/Image/OCR/Tesseract.pm 行 77.

誰かがこのエラーメッセージの可能性を助けてくれますか/または誰かがこの問題を抱えている場合は?

0 投票する
1 に答える
1206 参照

image-processing - コンピュータ ビジョン - イメージ マッチングまたは OCR を使用して、テキストのみの本のページを認識しますか?

テキストのみ(画像なし)の本のどのページを読んでいるかを認識できるようにしたい...最善のアプローチは何ですか:

私は当初、ある種の画像マッチングを考えていましたが、すべてのテキストブックのページが非常に似ているように見えますが、これがうまく機能するかどうかわかりませんか?

次に考えたのは、OCR を使用することでした??

アイデアや提案...ありがとう!

0 投票する
2 に答える
2709 参照

c# - Tesseract - 参照の追加が機能しない

私は次の手順に従っています:

  1. ここからバイナリをダウンロードし、アセンブリ Tessnet2.dll の参照を .NET プロジェクトに追加します。
  2. ここから言語データ定義ファイルをダウンロードし、tessdata ディレクトリに配置します。Tessdata ディレクトリと実行ファイルは同じディレクトリにある必要があります。
  3. Program.cs サンプルを見てください。

次を使用してlibからクラスを呼び出す場合:

次のエラーが表示されます。

名前の名前空間またはタイプ 'tessnet2' が見つかりませんでした。using ディレクティブまたは一連の参照モジュール (アセンブリ) が必要ですか?

どうすればこれを解決できますか?

ありがとう!

0 投票する
1 に答える
1384 参照

iphone - Tesseract OCR:返された各文字の読み取りエラーの大きさを見つける方法は?

私はiPhoneアプリケーションでTesseractOCRエンジンを使用して、請求書の写真から特定の数値フィールドを読み取ります。多くの写真の前処理(適応しきい値処理、アーティファクトクリーニングなど)を使用すると、結果は最終的にかなり正確になりますが、改善したい場合もあります。

ユーザーが暗い場所で写真を撮り、写真にノイズやアーティファクトがある場合、OCRエンジンはこれらのアーティファクトを追加の数字として解釈します。場合によっては、たとえば「32,15」EURの数値を「5432,15」EURと読み取ることができますが、これは製品に対する最終的なユーザーの信頼にはまったく適していません。

読み取られた各文字に関連付けられた内部OCRエンジンの読み取りエラーがある場合、小さなノイズピクセルで認識されるため、前の例の「54」桁よりも高くなると思います。この読み取りエラー値は、誤った数字を簡単に破棄できるようになります。

tesseract OCRエンジンから返された個々の文字の読み取りエラーの大きさ(または「精度係数」値)を取得する方法を知っていますか?

0 投票する
1 に答える
1008 参照

machine-learning - Tesseract より多くの OCR を実行すると、文字を学習しているように見えます。学習データを次の使用までに保存するにはどうすればよいですか?

OCR を実行する特定の 10 枚の画像セットがあります。それらはすべて数字です。やや短く、各画像で約 20 桁です。特定のイメージが 1 つあります。最初に実行すると、いくつかの不一致が生じます。ただし、最初に他のテストを実行してからそのテストに戻ると、すべての文字が一致します。

より多くの OCR 操作が実行されるにつれて、Tesseract が文字を学習していると結論付けたいと思います。これは非常に喜ばしいことです。問題は、可能であれば、学習データを保存することです.Tesseractは、次に使用するときにそれを取得することを知っていますか?

0 投票する
1 に答える
840 参照

android - Tesseractは画像を解析し、nullを返します

正八胞体法に問題があります。以下のコードを使用すると、アプリケーションが直接停止します。以下は私のjni.cppファイルです。

そして、このinitメソッドのデータパスは何ですか?前もって感謝します。

私のLogCatは以下の通りです。

そして私のパッケージはcom.temp.unique.ocrです。私の申請プロセスは直接終了しました。

0 投票する
1 に答える
1194 参照

android - Can anyone out there help me for Ocr business card scanner concept using tesseract-ocr in android?

I am new in android .I want to make application of business card scanner using tesseract-ocr in android. I search lots of things related to these project.based on that I used these modules :

now the main problem is : I dont know how to run tesseract-ocr code with the help of ndk and cygwin. I have download the below given files. Can someone please let me know whether these files would be helpful to me or not.

many thanks, any knowledge about any particular solutions much appriciated !:)

0 投票する
2 に答える
11938 参照

ocr - Tesseractは2つの数字を混同します

画像から数字をスキャンするアプリケーションを書いています。

数字はOCR-Bフォントを使用しており、文字が含まれている場合もあり+ます>

これは私のソース画像です:

ソース画像

文字セットを言及された文字に制限した場合でも、Tesseractを使用したスキャンはあまり良くありませんでした。TesseractのOCRBトレーニングファイルが見つからなかったため、自分でトレーニングすることにしました。

このトレーニング画像を作成し、そこからボックスファイルを作成しました。ボックスファイルは正しく、すべての文字が正しく一致しています。

次に、ここで説明するすべての手順を実行して、他の必要なファイルを作成しました。

この新しくトレーニングされたOCR-Btessdata-setを使用すると、ソースイメージでかなり良い結果が得られますが、小さなバグが1つあります。すべて1がsと間違えられ8、その逆も同様です。画像の処理に使用されたコマンドは

ソース画像の出力は

0800000001456> 8 00000195731208 8 01050008 023+ 08 0301226> 20

すべて1のsと8sを入れ替えてソース画像と比較すると、出力は正しくなります(無視できる最後の2文字を除く)。

これはどのように起こりますか?トレーニングプロセスでミスをしましたか?どうすれば修正できますか?