opencv - Tesseract での IplImage(OpenCV) データの処理

Question

OpenCV から取得した画像を処理する必要があります。

私はこれまでに書いた：

IplImage* img=0;

img=cvLoadImage("paket2.tif");


api.SetRectangle(0,0,img->width, img->height);
api.SetImage((uchar*)img->imageData,img->width,img->height,img->depth/8,img->width*(img->depth/8));
//i tried also below line
//api.SetImage((uchar*)img->imageData,img->width,img->height,img->depth/8,img->widthStep);

int left,top,right,bottom;
left=0;top=0;right=0;bottom=0;
api.Recognize(NULL);
tesseract::ResultIterator *ri=api.GetIterator();
char * sonuc=(*ri).GetUTF8Text(tesseract::RIL_SYMBOL);

if((*ri).BoundingBox(tesseract::RIL_SYMBOL,&left,&top,&right,&bottom))
{printf("bb dogru\n");printf("%d,%d,%d,%d",left,top,right,bottom);}
printf("sonuc:%s",sonuc);

IplImage->widthStep をバイトごとに渡すと、左右の値に「間違った」境界ボックスがあり、画像内のすべてのテキストを読み取ることができません。

IplImage->width*(IplImage->depth/8) を渡すと、boundingBox 関数は false を返します。

アイデアをいただければ幸いです。前もって感謝します。

score 2 · Accepted Answer

サブマトリックスを新しい IplImage にコピーします。正しい情報 (幅、高さ、ステップ) で tesseract イメージヘッダーを作成します。tesseract データポインターを iplImage データポインターにリンクします。

tesseract ポインタにアクセスする方法を思い出せませんが、opencv の場合は image->data.ptr です

score 1 · Accepted Answer

ここのこのコードは私のために働いた：

tesseract::TessBaseAPI tess; 
tess.Init(argv[0], "eng", tesseract::OEM_DEFAULT); 
cv::Mat image = cv::imread("...");
tess.SetImage((uchar*)image .data, image.size().width, image.size().height, image.channels(),     image.step1());
tess.Recognize(0);
const char* out = tess.GetUTF8Text();

opencv - Tesseract での IplImage(OpenCV) データの処理

2 に答える 2

Related

Reference