“python-tesseract”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

1669 参照

python - pytesseract.TesseractError: (-5、'dyld: ライブラリがロードされていません: 理由: 画像が見つかりません)

Pytesseract で image_to_string() 関数を使用すると、次のエラーが発生します。

Tesseract (view Brew)、PyTesseract、PIL を再インストールしようとしましたが、うまくいきませんでした。私がテストした他のマシンでは問題はありませんでした。すべて OSX Yosemite 10.10.3 です。

困惑した。

2015-04-30T14:56:57.573

0 投票する

2 に答える

594 参照

cygwin - Tesseract 3.03 コンパイルエラー: 'select' はこのスコープで宣言されていませんでした

Tesseract 3.03 ソースコードcygwinのコンパイルに使用しています。

makeの後に実行すると、次のエラーが発生しますconfigure。Tesseract のソースコードを変更する知識はありません。以前にこのエラーを見た人はいますか? または、Tessearct 3.03 のビルド済みバージョンはありますか? このバージョンにはトレーニングツールが含まれておりtext2image、make training.

ここに画像の説明を入力

追加 1

以下は、問題のあるコードスニペットです。

ここに画像の説明を入力

select関数はC++ライブラリ関数のようです。私のCygwinのインストールにいくつかのライブラリが欠けているのかもしれません。しかし、どちらかわかりません。

追加 2

rubenvbこのスレッドに関する次の提案: MinGW /MSYS で "xz-5.2.1" を作成中にエラーが発生しました

私MSYS2 + MinGW-w64はコンパイルするために使い始めますTesseract 3.03。すべての依存関係と前提条件と戦った後。私はついに成功しましconfigureたTesseract 3.03 source。中に次のエラーが発生しましたmake:

ここに画像の説明を入力

同様のスレッドを見つけました:致命的なエラー: strtok_r.h: そのようなファイルまたはディレクトリはありません (MinGW で tesseract-ocr-3.01 をコンパイルしている間)

いくつかのファイルを tesseract ソースに手動で追加する必要があるようです。しかし、私はそれをどこに置くべきかわかりません。

今のところ、私は少し眠る必要があります。

誰かがこの問題に光を当ててくれることを願っています。明日も続きます…

参照

vs2013でTesseract 3.03をコンパイルする

http://vorba.ch/2014/tesseract-3.03-vs2013.html

Cygwin で Tesseract 3.02 をコンパイルする

http://vorba.ch/2014/tesseract-cygwin.html

cygwin tesseract python-tesseract

2015-05-05T14:27:15.610

0 投票する

1 に答える

728 参照

fonts - 「ラスターフォント」用のトゥルータイプフォントファイルはありますか?

Tesseractいくつかのスクリーンショットの OCR を使用しています。スクリーンショットの文字はraster fonts. ただし、トレーニングにはファイルTesseractが必要です。True Type Font

フォルダーには多くの True Type フォントファイルがありWindows/Fontsます。ラスターフォント用のものがあるかどうか疑問に思っていますか?

fonts tesseract raster truetype python-tesseract

2015-05-11T08:47:54.917

0 投票する

1 に答える

368 参照

python - mod_wsgiで使用するとpytesseractエラーが発生する

複数の場所から処理する画像を送信できるように、OCR Web サービスをセットアップしようとしています。

私は cgi で何もしたことがないので、mod_wsgi を試す時が来たと言いました。すべてのライブラリとopencvとpytesseractをインストールするのに、2日ほどかかりました。「通常の方法」（新しいpythonウィンドウインタープリターを開始）で実行すると、OCRは正常に機能します。一部のライブラリが正常に動作しているにもかかわらず、mod_wsgi で動作させるのに多くの問題がありました。

私はpytessearchで立ち往生しました。私がそれを実行すると：

すべての作品ファイル。

私がこのようにしても：

これも同様に機能します。

mod_wsgi を使用してこれを行うと、httpd ログファイルに次のエラーが記録されます。

ここに私のapp.wsgiファイルがあります:

ソースでわかるように、サブプロセスからの check_output を使用して、新しい pytesseract プロセスを自分で開始しようとしましたが、同じエラーが発生します。

ソースから tesseract と mod_wsgi をビルドしました。しかし、これもまた mod_wsgi と何か関係があると確信しています。なぜなら、私が Python で通常どおり実行すると機能するからです。

更新: mod_wsgi と opencv で同様の「奇妙な」問題が発生しました。質問と回答はここにあります: mod_wsgi django アプリから numpy をインポートするときの ctypes エラー

任意の提案をいただければ幸いです。

python tesseract python-tesseract

2015-05-18T17:35:17.443

0 投票する

1 に答える

1393 参照

ocr - Ubuntu に tesseract_ocr を正常にインストールした後、tesseract_ocr という名前のモジュールが表示されません。

Linux ターミナルから Tesseract OCR をインストールしましたが、Python にインポートしようとすると、次のエラーが表示されました。

/usr/bin/python2.7 /home/web/Documents/pnt/ocr.py
トレースバック (最新の呼び出しが最後):
ファイル "/home/web/Documents/pnt/ocr.py"、1 行目、
インポート tesseract 内
ImportError: tesseract という名前のモジュールがありません

ocr pycharm tesseract python-tesseract

2015-06-24T09:59:01.820

0 投票する

1 に答える

1230 参照

python - リモート PDF のページを OCR 用の一時画像に変換する

ページごとに読み取り、OCRテキストを提供するOCRにそれぞれを渡し続ける必要があるリモートPDFファイルがあります。

cStringIOorを使用することを考えtempfileましたが、この目的でそれらを使用する方法がわかりません。

この問題をどのように解決できますか?

python pdf wand python-tesseract

2015-06-28T00:39:11.990

0 投票する

1 に答える

10062 参照

python - Windows で Python OCR を使い始めますか?

これまで Python を使用したことがなく、どこから始めればよいかわかりません。私の目標は、数字と多色の背景の画像データを取得し、正しい文字を確実に識別できるようにすることです。これに必要なツールを調べたところ、tesseract-ocr と pytesser だけでなく、必要になる可能性のあるすべてのパッケージが含まれている Anaconda Python ディストリビューションを見つけました。

残念ながら、私は始め方に迷っています。私は PyCharm Community IDE を使用しており、OCR を把握するためにhttp://www.manejandodatos.es/2014/11/ocr-python-easy/のガイドに従っているだけです。

これは私が使用しているコードです:

私が使用しているAnacondaディストリビューションにはPILがあると思いますが、次のエラーが発生しています:

誰かが私を正しい方向に向けることができますか?

python python-imaging-library anaconda python-tesseract pytesser

2015-06-28T19:37:55.727

0 投票する

2 に答える

1592 参照

image-processing - MTGカードでtesseractを使用する

これまでの私の最初のハードルは、MTG カードの画像で tesseract バニラを実行するとカードのタイトルが認識されないことです (正直なところ、そのテキストを使用して残りのカード情報をデータベースから引き出すことができるので、必要なのはそれだけです) MTGカードで使用されているフォントを認識するためにtesseractをトレーニングする必要があるかもしれませんが、画像のセクション（特にタイトル）でtesseractがテキストを見ていない、または検出していないという問題があるのではないかと思っています。

編集: 参照用に MTG カードの画像を含めます。http://gatherer.wizards.com/Handlers/Image.ashx?multiverseid=175263&type=card

image-processing ocr python-tesseract

2015-07-01T18:30:54.273

問題タブ [python-tesseract]

追加 1

追加 2

参照

Reference