問題タブ [leptonica]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
381 参照

android - レプトニカピックスを回転させる

私はtesseract-android-tools apiを使用しています。結果のためにtesseractを呼び出す前に、画像をpixとして回転させる必要があります。使ってみます

回転した画像を保存すると、コンテンツだけが回転したことがわかります。追加画像をご覧ください。私がしたことは、正しい寸法で Rect を設定しましたが、結果はありません:

または正しい寸法で新しいPixを作成しても、結果はありません:

pixレベルで画像を正しく回転させる方法はありますか?

画像を回転させる必要があります

Rotate.rotate(..) を呼び出した後、コンテンツだけを回転します

0 投票する
3 に答える
11849 参照

ios - OCR:画像からテキストへ?

質問のコピーまたは繰り返しとしてマークを付ける前に、まず質問全体をお読みください。

私はpressentで行うことができます以下のとおりです:

  1. 画像を取得し、OCRの目的の部分をトリミングします。
  2. tesseractおよびを使用して画像を処理しleptonicaます。
  3. 適用されたドキュメントがチャンクにトリミングされる場合、つまり画像ごとに1文字の場合、96%の精度が得られます。
  4. そうしないと、ドキュメントの背景が白色でテキストが黒色の場合、ほぼ同じ精度が得られます。

たとえば、入力が次の写真の場合:

写真スタート

ここに画像の説明を入力してください

写真終了

私が欲しいのは、ここに画像の説明を入力してください
ブロックを生成することなく、この写真に対して同じ精度を得ることができることです。

tesseractを初期化し、画像からテキストを抽出するために使用したコードは次のとおりです。

正八胞体の初期化のために

.hファイル内

.mファイル内

画像からテキストを取得する場合

しかし、ナンバープレート画像がnullであるか、画像にガベージデータが含まれているため、適切な出力が得られません。

そして、最初の画像、つまりテキストが黒の白い背景の画像を使用すると、出力は89〜95%正確になります。

私を助けてください。

任意の提案をいただければ幸いです。

アップデート

リンクを提供してくれた@jcesarと、貴重な情報とガイドを提供してくれた@konstantinpribludaに感謝します。

画像を適切な白黒形式に変換することができます(ほぼ)。したがって、認識はすべての画像で優れています:)

画像の適切な2値化についてサポートが必要です。どんなアイデアでも大歓迎です

0 投票する
1 に答える
599 参照

objective-c - NSImageとLeptonicaPixの間で変換する

スキャンしたページをクリーンアップするためにCocoaOSXプログラムに取り組んでおり、Leptonicaのライブラリを使用して手間のかかる作業を行いたいと考えています。私はこの投稿これ、そしてこれでいくつかの情報を見つけました。NSImageからCGImageを取得でき、LeptonicaPixイメージにデータを書き込むことができます。私が抱えている問題は、75%の確率で、画像が理髪店のポールタイプのパターンで歪んで表示されることです(画像の上から下へのピクセルの連続する各行は、さらに右にシフトします)。時々絵がうまく出てきますが。画像データの設定に問題があると思いますが、それは私の得意ではないので、問題を理解するのに苦労しています。次のコードを使用してPixイメージを作成しています。

pix構造体は次のように定義されています。

0 投票する
0 に答える
431 参照

android - Tesseract + Leptonicaを使用してAndroidでフォントサイズを検出する

Tessearact と Leptonica (二値化と大津のしきい値処理用) ライブラリを使用して、テキストに対して OCR を実行する Android アプリを作成しています。私の質問は次のとおりです。アプリが読み取るフォントサイズを検出または少なくとも区別(大きい/小さい)できますか?

0 投票する
1 に答える
2559 参照

android - Android Tesseract & レプトニカ OCR。個々のボックスと文字を読み取る

私は Android で Tesseract を使用しています。画像から読み取った文字列とボックスを抽出する次のコードがあります。

ここでは、各文字のテキストとボックスが表示されますが、テキストのサイズがボックス配列と異なる場合があり、読み取った文字でボックスを設定することはできません。

正確なボックスとその文字を取得する方法はありますか?

0 投票する
1 に答える
2819 参照

c# - PNGファイルを検出するためにTesseractにライブラリが必要ですか?

PNGファイルを読み取るためにTesseract 2.04を実行していますが、このエラーが発生しています:-

あちこち探して、いろいろ試してみましたが、根本的な原因が見つかりません。一部のページでは、Leptonica ライブラリのインストールを示唆していますが、具体的なものは何もありません。すべてのバージョンの Tesseract は、デフォルトで PNG ファイルを読み取ることができるようです。何が欠けている可能性がありますか?

ありがとう!

0 投票する
2 に答える
1507 参照

tesseract - tesseract (mac os x) の traindata を作成できません

tesseract の特定のフォントのトレーニング データを作成しようとしていて、次のコマンドで失敗しています。

ターミナルに次の出力が表示されます。

MacPort から tesseract と leptonica をインストールしました。

以下は、ターミナルでの tesseract -v コマンドの出力です。

0 投票する
4 に答える
20017 参照

java - ライブラリ 'tesseract' をロードできません: libtesseract.so: 共有オブジェクト ファイルを開けません: そのようなファイルまたはディレクトリはありません

しばらくの間、MBP でtesseract とTess4Jを実行しています。今日、私は自分のアプリをサーバーに移行し始め、サーバーにすべてをインストールし始めました。Tomcat で Tess4J を実行する前に、単純な Java プログラムを実行して、すべてが正常で適切であることを確認してみました。そうではありません...

  • 私はcentOS 64ビットサーバーを使用しています
  • tesseract をインストールしましたが、正常に動作しています -tesseract myimage.jpg mytextデータを生成します

ただし、Tess4j を使用する単純なクラスを実行すると、次のエラーが発生します。

スレッド「メイン」の例外 java.lang.UnsatisfiedLinkError: ライブラリ 'tesseract' をロードできません: libtesseract.so: 共有オブジェクト ファイルを開けません: そのようなファイルまたはディレクトリはありません

これまでに行ったこと

  • sudo ldconfigtesseractをインストールした後に実行しました
  • libtesseract.so を検索しましたが、その場所で見つかりました/usr/local/lib/libtesseract.so

サーバー上のフォルダーには、次のファイルが含まれています。

tesseract -v は以下を生成します:

質問

libtesseract.so が存在することを Tess4J に認識させるにはどうすればよいですか?enter code here

0 投票する
1 に答える
3032 参照

ocr - Tesseract で boxfile を作成 (または tiff を開く) できません

新しいフォント用に Tesseract OCR エンジンをトレーニングするために、これらの手順に従っています。

しかし、ボックスファイルを作ろうとするとエラーが出てしまいます。これは私が使用するコマンドです:

そして、ここにエラーメッセージがあります:

一部のグーグルは、Leptonica のインストールにエラーがある可能性があることを示唆しています。Leptonica が自分のコンピューターにインストールされているかどうかさえわかりません。Web ページはいくつかの README (「README」と呼ばれるものと「ドキュメント」と呼ばれるもの)でかなり混乱しています。 Windowsで動作します。Visual Studio 2008 の Express Edition を使用しているため、提案されたコマンド プロンプトを使用できません。

だから、私の質問は次のとおりです。誰かが何が間違っているのか、どうすれば修正できるのか知っていますか?