問題タブ [text-recognition]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
3 に答える
44257 参照

c++ - C/C++/Object-C テキスト認識ライブラリ

C/C++/Objective-C の無料/オープンソースのテキスト認識ライブラリを知っている人はいますか? 基本的には、画像をスキャンしてすべてのプレーン テキストを読み取ることができるものです。

0 投票する
1 に答える
2043 参照

image-processing - スキャンした文書の OCR 精度を向上させる

標準の Brother A3 Multifunction を使用して大量の A3 ドキュメントをスキャンし、FineReader Pro を使用して画像を OCR 処理しています。

ただし、認識された文字に多くのエラーが発生し、英数字以外の奇妙な文字がたくさんあります。

スキャンした画像を前処理するか、認識したテキストを後処理して、OCR の精度をプログラムで改善するためのヒントを誰かに教えてもらえますか?


編集:サンプル pdf を見つけます。これには、最も悪い結果が得られるサンプル画像がいくつか含まれています。

0 投票する
2 に答える
5237 参照

iphone - 画像をテキスト形式に変換する iphone クラスはありますか?

ある種の画像をテキスト形式に変換する iPhone アプリケーションを開発したいと考えています。この目的を達成するための組み込みライブラリがあることを知りたいですか?

0 投票する
3 に答える
10729 参照

delphi - デルファイの画像からテキストを認識する

この問題への取り組み方についてアドバイスが必要です。私はいくつかの画像データを持っています:*。jpg、*。bmp...そして私はそれからデータを抽出する必要があります。データは英数字のテキストです。私はデルファイで働いています。

0 投票する
4 に答える
37074 参照

c# - 画像からテキストを抽出するために使用するライブラリはどれですか?

私は、低レベルの数学の問題(98 * 13など)の画像が与えられたときに答えを出力できるはずのプログラムを書いています。数字は黒、背景は白になります。キャプチャではなく、数学の問題のイメージです。

数学の問題には2つの数値と1つの演算子しかなく、その演算子は+、-、*、または/のみになります。

明らかに、私は計算の方法を知っています;)画像からテキストを取得する方法がわかりません。

無料のライブラリが理想的です...ただし、自分でコードを作成する必要がある場合は、おそらく管理できます。

0 投票する
2 に答える
2480 参照

java - JPG画像内のテキストのバウンディングボックスを見つける

私の質問はthis oneに似ていますが、範囲がより具体的です。

私のカード ゲーム アプリケーションでは、ユーザーがスキャンした jpeg 画像内の単語をクリックできるようにしたいと考えています。こちらのサンプルポケモントレカをご覧ください。

この場合、ユーザーはテキスト「Scratch」の上にマウスを置くことができるはずです。テキストの周りにパルス状の長方形の境界線が表示され、クリック可能であることを示します。問題は、テキストの境界をどのように検出するかです。ユーザーがクリックする可能性がある事前にわかっている単語の配列があります (これらはカードごとにデータベースから取得されます)。例を続けると、この場合の配列は ["Scratch", "Live Coal"] になります。ユーザーが「Scratch」をクリックすると、アプリケーションはコールバックを介して、「Live Coal」ではなく「Scratch」が選択されたことを知る必要があります。

この問題を解決するために光学式文字認識ライブラリを使用することを考えていましたが、オープンソースのオプションは品質が低く (GOCR など)、複数のプラットフォーム (Tesseract など) で十分にテストされていません。Windows と Mac の互換性だけが気になります。OCR を必要としない明白な/より単純なソリューション/アルゴリズムがありませんか? データベースには何千ものスキャンされたカードが存在するため、各カードの境界ボックスに単純に手作業でコーディングすることはできません。ユーザーは、クリック可能なテキストの配列を伴う独自のカスタム カード スキャンをアップロードすることもできます。

テキストの色は必ずしも黒ではありません。許可されるさまざまなカードとテキスト スタイルのこのパノラマをご覧ください。黒のカードには白のテキストがあり、最後から 3 番目のカード (ゼクロム) には黒のテキストと白のアウトラインがあります。

任意のプログラミング言語でのソリューションが高く評価されています。ただし、オープンソースのアルゴリズムやライブラリを探していることに注意してください。私のコードは主にこれら 2 つの言語で作成されているため、Ruby または Java で解決策があれば、なおさらです。

編集:配列内の単語/フレーズの順序がカードと同じになることを忘れていました。したがって、配列は ["Live Coal", "Scratch"] ではなく ["Scratch", "Live Coal"] になります。これについて言及しているのは、タスクを単純化できる可能性があるためです。したがって、この例では、単純に黒いピクセルを探すことができます (ただし、白い円の中の黒い星に注意する必要があります)。ただし、攻撃名の下に小さいフォントで説明テキストがある場合は、より困難なケースがあります (例については、パノラマを参照してください)。

0 投票する
1 に答える
488 参照

php - PHPでスクリーンショットから字幕を取得する方法は?

映画のスクリーンショットから字幕を取得します。例 ここに画像の説明を入力してください

それはつかむでしょう

ねえ、どうしてみんなリラックスしてみませんか?

字幕とは関係ありません。スクリーンショットです。字幕なので、フォントの種類の大きさなどがわかりやすくなります。

ほとんどの人がPHPOCRライブラリと言うことは知っていますが、背景は常に異なるため、機能しないように見えます。

0 投票する
3 に答える
2505 参照

image-processing - MathematicaのTextRecognizeが標準に達していない

下のスクリーンショットを見て、これが機能しない理由を教えてください。TextRecognizeのリファレンスページにある例はかなり印象的です。このような1文字を認識することは問題ではないと思います。文字のサイズを変更したり、画像を鮮明にしたりしてみました。

これを自分で試してみたい場合に備えて、この投稿の下部に使用している画像を含めました。また、Google画像検索で「Wordfeud」を検索すると、このようなものがさらにたくさん見つかります。

Mathematicaのスクリーンショット

Wordfeudボード