2

OpenCV から取得した画像を処理する必要があります。

私はこれまでに書いた:

IplImage* img=0;

img=cvLoadImage("paket2.tif");


api.SetRectangle(0,0,img->width, img->height);
api.SetImage((uchar*)img->imageData,img->width,img->height,img->depth/8,img->width*(img->depth/8));
//i tried also below line
//api.SetImage((uchar*)img->imageData,img->width,img->height,img->depth/8,img->widthStep);

int left,top,right,bottom;
left=0;top=0;right=0;bottom=0;
api.Recognize(NULL);
tesseract::ResultIterator *ri=api.GetIterator();
char * sonuc=(*ri).GetUTF8Text(tesseract::RIL_SYMBOL);

if((*ri).BoundingBox(tesseract::RIL_SYMBOL,&left,&top,&right,&bottom))
{printf("bb dogru\n");printf("%d,%d,%d,%d",left,top,right,bottom);}
printf("sonuc:%s",sonuc);

IplImage->widthStep をバイトごとに渡すと、左右の値に「間違った」境界ボックスがあり、画像内のすべてのテキストを読み取ることができません。

IplImage->width*(IplImage->depth/8) を渡すと、boundingBox 関数は false を返します。

アイデアをいただければ幸いです。前もって感謝します。

4

2 に答える 2

2

サブマトリックスを新しい IplImage にコピーします。正しい情報 (幅、高さ、ステップ) で tesseract イメージ ヘッダーを作成します。tesseract データ ポインターを iplImage データ ポインターにリンクします。

tesseract ポインタにアクセスする方法を思い出せませんが、opencv の場合は image->data.ptr です

于 2011-10-25T06:15:53.403 に答える
1

ここのこのコードは私のために働いた:

tesseract::TessBaseAPI tess; 
tess.Init(argv[0], "eng", tesseract::OEM_DEFAULT); 
cv::Mat image = cv::imread("...");
tess.SetImage((uchar*)image .data, image.size().width, image.size().height, image.channels(),     image.step1());
tess.Recognize(0);
const char* out = tess.GetUTF8Text();
于 2011-11-15T15:31:32.127 に答える