問題タブ [text-recognition]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - Java - 画像による一文字認識
これらのタイプの画像を認識するために Ocr フレームワークを使用しようとしています: これらは 2 文字の G.
asprise の aocr.jar を使用してみましたが、このコードではうまくいかないようです。
どうすればこれを機能させることができるか考えた人はいますか? 最終的に他のフレームワークで?
ありがとう :)
編集:コンパイルはランタイム例外なしで行われました。s.length() は 0 を返しました。そのため、彼は何も読み取っていないようです。
画像を実際のテキストの画像に置き換えると、テキストが完全に出力されます。
私はそれが1 Gを返すことを期待/望んでいました
ios - iOS で画像からテキストの位置を検出して抽出する方法
画像からテキストの位置を検出して抽出する方法。たとえば、ペプシ ボトルの画像の「pepsi」というテキスト。 http://www.csmonitor.com/var/ezflow_site/storage/images/media/content/2013/0321-new-pepsi-bottle.jpg/15343519-1-eng-US/0321-new-pepsi-bottle. jpg_full_600.jpg
java - 短い単語を元の単語に変換する
いくつかの単語カウントアルゴリズムを使用しましたが、よく見ると、たとえば「それは」を1つの単語としてカウントするため、テキスト内の元の単語よりも少ない単語が出てきたのではないかと思っていました. それで解決策を見つけようとしましたが、うまくいきませんでした。そこで、「それは」のような「短い言葉」を「基本的な言葉」に変換する何かが存在するかどうかを自問しました。
imagemagick - tesseract-OCRを使用してテキストを抽出する前に、レシート画像を前処理してレシート画像のテキスト領域を識別します
tesseract-OCRエンジンを使用してテキストを抽出する前に、 ImageMagickを使用してレシート画像を前処理しています。を使用して画像からノイズを除去しました
ここで、テキストで領域を切り取る必要があります。ImageMagickには、画像から境界線を削除するマスキング機能がありますが、私の場合、レシート画像の背景が均一でないため、マスクの作成が機能していないようです。
ここから SWT ' Stroke Width Transform
'自然画像のテキストを識別する' を行ってきましたこれは imagemagick (他の便利な開発者向け画像処理ツールである可能性があります) を使用してテキストを識別し、境界線を省略できるようにすることはできますか? 前もって感謝します。
ios - iOS はテキストとテキスト区切りを認識します
テキスト認識にTesseractを使用しています。
テキスト間のパディングを認識し、同じパディングで pdf や .doc ファイルなどを作成するにはどうすればよいですか?
ソース ページにテキスト (新聞など) を含む 3 つの列が含まれているとします。このテキストを相互に適切なパディングとマージンで認識し、ページにするにはどうすればよいですか?
おそらく、同じアルゴリズムまたはアルゴリズムだけを実行する例またはライブラリを提案できますか?