1

これまでの私の最初のハードルは、MTG カードの画像で tesseract バニラを実行するとカードのタイトルが認識されないことです (正直なところ、そのテキストを使用して残りのカード情報をデータベースから引き出すことができるので、必要なのはそれだけです) MTGカードで使用されているフォントを認識するためにtesseractをトレーニングする必要があるかもしれませんが、画像のセクション(特にタイトル)でtesseractがテキストを見ていない、または検出していないという問題があるのではないかと思っています。

編集: 参照用に MTG カードの画像を含めます。http://gatherer.wizards.com/Handlers/Image.ashx?multiverseid=175263&type=card

4

2 に答える 2

1

わかりました、reddit プログラミング フォーラムで質問したところ、私が追求しようとしている答えを見つけたと思います。

tesseract のトレーニング機能は、確かに珍しいフォントのレートを改善するためのものですが、それが成功率が低い理由ではないでしょう。テキストが存在する環境は十分に制御されていません。カードの背景は、5 色のいずれかのテクスチャとアーティファクトと土地である可能性があります。Tesseract は処理前に画像をグレースケールするため、テキストと背景のコントラストが十分ではありません。カードをプリプロセッサに通して、色付きの領域を白にミュートし、モノトーンを強調することができます. これにより、コントラストが向上し、tesseract が文字を認識できるようになります。

まだこれに従っている人が、上記のパスが間違っていると信じている場合は、そう言ってください。

于 2015-07-09T15:45:42.500 に答える