問題タブ [tessnet2]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
screen - 画面スクレイピングツール
私は Screen Scraper Studio を使用しました。これには、座標を渡すことができる相互運用 dll があり、その領域をスクレイピングします。文字通り 4 桁の数字だけをスクレイピングしようとしていますが、このアプリケーションには非常に高価な開発者ライセンスが必要です。コーディングをほとんど必要とせず、座標を渡すだけですぐに使用できる他のプログラムはありますか? TESSnet2 ocr パッケージは、C# でかなりのセットアップが必要になるため、使用したくありません。何か案は?
c# - tessnet2 を機能させる方法が見つかりません
コンソール アプリケーションを作成しました。tessnet2_32 への参照を追加しました。
私もに変更しようとし"C:\temp\tessdata"
ました
tessdata
フォルダー自体には 9 個のエラーが含まれており、これらの場所すべてに追加されました。
しかし、それは常にその .Init 行にメッセージとともに存在します:
Cしか持っていないのにZディスクにアクセスしようとしている理由が想像できません。または、エラーを完全に誤解しています。
誰かが何をすべきか、および/または私が間違っていることを段階的に投稿するのに十分親切でしょうか? 30以上のGoogleリンクを読んだ後でも、完全に迷っています.
vb.net - Tessnet2 OCR の結果が悪い理由
tessnet2 を使用して、.tif 画像からテキストを取得しています。たとえば、画像から10進数の「700」を取得したいのですが、これを取得しています:「Mupann」私はフランス語のtessdataを使用していますここで私が使用しているコード:
ありがとう
c# - Tessnet2Init-メソッドが特定のtessdataパスでクラッシュする
Tessnet2アセンブリ(Tesseractを使用)を使用してOCRを実行しています。残念ながら、initメソッドを呼び出した後、プログラムは例外なくクラッシュします。
ドイツ語フォルダには、次のtesseract2単語データが含まれています。
- deu.DangAmgigs
- deu.freq-dawg
- deu.inttemp
- deu.normproto
- deu.pffmtable
- deu.unicharset
- deu.user-words
- deu.word-dawg
パスに使用するnull
と、マシンにtesseractをインストールしたため、正常に機能します。ただし、プログラムがdeplyoされる場所では、tesseractがインストールされていることが保証されていないため、パスを使用したソリューションが必要です。
c# - Tessnet2 OCR は数字のみを返します
ac# アプリケーションで tessnet2 を使用して画像からテキストを読み込もうとしています。これは私のコードです:
結果の文字列には数字しか含まれていませんが、私の写真には文字が含まれており、その理由がわかりません。
ありがとうございました
c# - Tessnet2 が 1 文字のみを返す
アプリケーションを作成していて、画像を読み取ってテキストを抽出したいと考えています。ポルパスをテストするために、6 文字の画像を渡します。これが私のコードです。
結果は 100 です: ~
2回目に実行すると、次のように返されました:
100 : -
助けてください!!!ありがとう
c# - フォルダー内の c# foreach 画像
以下は、いくつかのコードです
- ディレクトリを作成します
- MagickNet を使用して PDF を個別の BMP 画像に変換し、それをフォルダー (ImagePath) に保存します。
- 次に、TessNet2 を使用してそのフォルダー内の各画像をスキャンし、情報を解析します。
ImagePath フォルダーをスキャンする foreach ループを取得できないようです。何か助けはありますか?
現在、エラーは 'foreach' ステートメントにあり、「型 'char' を 'System.Drawing.Image' に変換できません」と表示されています。
c# - OCR 単語認識ロジック
以下は、TessNet2 (OCR フレームワーク) を使用して、TessNet2 に組み込まれている OCR 関数によってキャプチャされた単語のリストをスキャンする関数です。私がスキャンしているページの品質は完璧とは言えませんので、単語の検出は 100% 正確ではありません。
そのため、「S」と「5」、または「l」と「1」を混同することがあります。また、大文字と小文字は考慮されません。したがって、両方のケースを検索する必要があります。
それが機能する方法は、紙の上で互いに近い特定の単語を検索することです。したがって、最初の一連の単語 [I] は「Abstracting Service Ordered」です。ページにこれらの単語が隣り合って含まれている場合、次の単語セット [j] に移動し、次に次の [h] に移動します。ページに 3 つの単語セットがすべて含まれている場合、true が返されます。
これは私が考えた最良の方法ですが、ここの誰かが別の方法を試してくれることを願っています.
c# - 文字列の後の次の単語を見つける
したがって、単語のリストをスキャンし、「Control Number:」を見つけて wordNumber に設定し、次の単語を controlNum (返そうとする文字列) に設定する以下のメソッドがあります。
しかし、RegExを使用して同様のアプローチを行う方法を見つけた後。controlNum を次の単語に設定する方法があるかどうかを確認したいと思います。正確な単語が見つからない場合に備えて、特定の文字/数字にはいくつかの異なるケースがあります。