問題タブ [tesseract]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
tesseract - グラフィックまたは画像内のテキストをtesseractで認識する方法はありますか?
まず、私の英語でごめんなさい。tesseractについて質問があります。認識したい画像をきれいにせずに、グラフィックまたは画像内のテキストを認識する方法はありますか? 最初に画像をきれいにし、グラフィックスと写真を削除し、テキストのみを残すためにそこで読んだもの. しかし、ユーザーがサーバーにアップロードして、人間の介入なしにこのニュースを認識できる新聞の切り抜きを望んでいます。それは難しいかもしれません。しかし、他の方法を知っていれば、彼らは感謝しています。どうもありがとうございました
android - Tesseract-android-Tools の使い方
tesseract-android-tools 1.00 を使用しています。インターフェース TessBaseAPI の使用を手伝ってください。
1 つの .jpg 画像を、画像の一部としてテキストを含む Android アプリケーションに渡したいと思います。次に、このtesseractエンジンを介して、それらのテキストを編集可能な形式に抽出したいと思います..
Androidでこのアプリケーションを作成するのを手伝ってください...
groovy - あいまい文字列一致
いくつかの画像で光学式文字認識を実行した後、おおよそのテキストが得られます。多くの場合、認識は大きくありません。たとえば、実際のテキスト「DATE」は「DHTE」または「0HTE」になります。基本的に、各行のデータを識別して抽出する必要があるため、完全な認識は必要ありません。日付変更線を識別するのに十分です。レーベンシュタイン編集距離を計算しようとしましたが、残念ながら、これは DATE と TIME に同様の値を与える傾向があります。現時点では、代わりに正規表現を使用してデータ パターンを一致させることができるかどうかを調査しようとしています。
マッチングプロセスを改善する方法/アルゴリズムはありますか? 幸いなことに、私の単語セットはそれほど大きくありません。
(私は ocr に tesseract を使用し、アルゴリズムに groovy/java を使用しています)
android - ANDROID アプリの Tesseract OCR 実行プロセス
まず、私の要件について言及したいと思います。
私は数ヶ月以来、ANDROID アプリケーションに取り組んできました。CYGWIN、JNI、NDK を介してアプリにリンクするには、OCR (光学式文字認識) のコードが必要です。TESSERACT OCR が利用可能な唯一のオープン ソース コードであることがわかりました。次のリンクから Tesseract OCR-3.00 のコードをダウンロードしました。
http://code.google.com/p/tesseract-ocr/wiki/ReadMe
ダウンロードしたファイルにある「INSTALL」ファイルに記載されている手順に従って、CYGWIN環境でコードを正常にコンパイルしました。最後に、すべての MAKE ファイルが生成されます。このコードをアプリで使用するには、CYGWIN で生成される「.so」ファイルが必要です。
今、直面している問題は次のとおりです。
次のリンクに記載されている手順に従って、完全なコード Tesseract OCR を ECLIPSE の Android アプリ コードにインポートしました。
http://mindtherobot.com/blog/452/android-beginners-ndk-setup-step-by-step/
上記のリンクに記載されている手順に従いました..しかし、上記のリンクに示されている例と比較すると、TESSERACT OCRのコードをインポートするのは非常に困難です。OCR の場合、「.so」を作成する最後のステップが機能しません。次の画像に示すようなエラーが表示されます![ここに画像の説明を入力][1]
提案: 次のステップに進む方法についての明確な説明を提案してください....誰か、明確な説明をするために時間がかかります..
ありがとうございます。それでは、お元気で
pdf - tesseract ocrマルチページpdfがハングする
PDFファイルをテキストに変換するために、Tess4jと呼ばれるTesseractのJavaライブラリを使用しています。1 ページの PDF ファイルだけでなく、Tiff ファイルでもうまく機能します。しかし、複数ページの PDF では、出力ファイルが生成されます。最後のページになると、doOCR 呼び出しを呼び出した元のアプリケーションにコントロールが戻らないようです。何もせずにそこにとどまる/ハングアップします。ネイティブコールが戻ってこないのは問題ですか.私には手がかりがありません.
この問題の解決策があれば、できるだけ早くお知らせください。
よろしく
ヴィッシュ
android - Tesseract OCR の「.SO」ファイル
Android アプリに Tesseract OCR (光学式文字認識) の「.so」ファイルを使用する必要があります。Tesseract OCRの「.so」ファイルを取得する方法を誰かに説明してもらえますか?
機能していない完全なプロジェクトをインポートしようとしました。
c# - C# tesnet2 混合モード "属性 'useLegacyV2RuntimeActivationPolicy' のスキーマ情報が見つかりませんでした。"
私は得る:
コンパイルしようとすると
http://www.pixel-technology.com/freeware/tessnet2/からロードされたtessnet2_32.dll(Tesseract .NETラッパー(v 2.04.0))をロードしました
私のapp.conf
誰がこれを引き起こす可能性があるか知っていますか?
iphone - iPhoneおよび/またはAndroid上のOcropusエンジン
iOSやAndroidでocropusを実行するための最良の方法は何ですか?
Ocropusを使用してモバイルデバイス上のコンテンツをデジタル化することに興味があります。訓練された「言語」モデルを使用してデバイスで予測を行うことに大きな関心があります。トレーニングはオフラインおよびデバイス外で行われます。モバイルデバイスでtesserectを実行している人が何人かいることは知っていますが、Ocropusで同じことを行うための多くの情報を見つけることができません。間違った道をたどる日を無駄にしないように、あなたの集合的な知恵の一部を大いに感謝します。
スクリプトを使用してアルゴリズムのプロトタイプを作成し、目的の特定のc ++コードを取得して、アプリケーションに直接含める方が簡単でしょうか。または、静的/動的ライブラリとしてコンパイルするのが最善ですか?
opencv - Tesseract 3 をトレーニングして、ガス メーターの実際の画像から数値を認識する
ガスメーターの実際の画像から数字を認識するように tesseract をトレーニングしようとしています。
私がトレーニングに使用する画像はカメラで作成されているため、露出オーバー、反射、影などによる画像解像度の低下、画像のぼやけ、照明不足またはコントラストの低下など、多くの問題があります。
トレーニングのために、ガス メーターの画像によってキャプチャされた一連の数字を含む大きな画像を作成し、ファイル ボックスを手動で編集して .tr ファイルを作成しました。その結果、鮮明で鮮明な画像の数字のみが認識され、ぼやけた画像の数字は tesseract によってキャプチャされません。
visual-studio - Tesseract OCR の C API でのビルド エラー
API の使用に関するリンクと、イメージ データを Tesseract で認識可能な形式にする別の方法を使用して、次のコードを記述し...tesseract/ccmain/
、Visual C++ プロジェクトのインクルード ディレクトリにディレクトリを追加しました (これは既に OpenCV で使用されています)。
……【OpenCVコードなど】……
エラーなしでコンパイルされましたが、ビルドしようとすると、すべての Tesseract 関連の関数呼び出しで「未解決の外部シンボル XXXXX」というエラーが発生します。コンパイル時に表示されず、ビルド時にのみ表示されるTesseractのリンクとインクルードに間違いがありますか?
どんな助けでも素晴らしいでしょう。
編集:これらはエラーメッセージです: