画像処理を行っていますが、JPEG および PNG 画像の各ピクセル値を個別に読み取りたいと考えています。
私の展開シナリオでは、(ターゲット コンピューターへのアクセスが制限されているため) サード パーティのライブラリを使用するのは面倒ですが、JPEG/PNG を読み取るための標準の C または C++ ライブラリはないと想定しています...
したがって、ライブラリを使用しない方法を知っている場合は素晴らしいです。そうでない場合でも、回答は大歓迎です!
C 標準には、ファイル形式を読み取るための標準ライブラリはありません。
ただし、ほとんどのプログラム、特に Linux プラットフォームでは、同じライブラリを使用してイメージ形式をデコードします。
jpeg の場合は libjpeg、png の場合は libpng です。
ライブラリが既にインストールされている可能性は非常に高いです。
これは、10 年前のソース コード (libjpeg を使用) から掘り出した小さなルーチンです。
#include <jpeglib.h>
int loadJpg(const char* Name) {
unsigned char a, r, g, b;
int width, height;
struct jpeg_decompress_struct cinfo;
struct jpeg_error_mgr jerr;
FILE * infile; /* source file */
JSAMPARRAY pJpegBuffer; /* Output row buffer */
int row_stride; /* physical row width in output buffer */
if ((infile = fopen(Name, "rb")) == NULL) {
fprintf(stderr, "can't open %s\n", Name);
return 0;
}
cinfo.err = jpeg_std_error(&jerr);
jpeg_create_decompress(&cinfo);
jpeg_stdio_src(&cinfo, infile);
(void) jpeg_read_header(&cinfo, TRUE);
(void) jpeg_start_decompress(&cinfo);
width = cinfo.output_width;
height = cinfo.output_height;
unsigned char * pDummy = new unsigned char [width*height*4];
unsigned char * pTest = pDummy;
if (!pDummy) {
printf("NO MEM FOR JPEG CONVERT!\n");
return 0;
}
row_stride = width * cinfo.output_components;
pJpegBuffer = (*cinfo.mem->alloc_sarray)
((j_common_ptr) &cinfo, JPOOL_IMAGE, row_stride, 1);
while (cinfo.output_scanline < cinfo.output_height) {
(void) jpeg_read_scanlines(&cinfo, pJpegBuffer, 1);
for (int x = 0; x < width; x++) {
a = 0; // alpha value is not supported on jpg
r = pJpegBuffer[0][cinfo.output_components * x];
if (cinfo.output_components > 2) {
g = pJpegBuffer[0][cinfo.output_components * x + 1];
b = pJpegBuffer[0][cinfo.output_components * x + 2];
} else {
g = r;
b = r;
}
*(pDummy++) = b;
*(pDummy++) = g;
*(pDummy++) = r;
*(pDummy++) = a;
}
}
fclose(infile);
(void) jpeg_finish_decompress(&cinfo);
jpeg_destroy_decompress(&cinfo);
BMap = (int*)pTest;
Height = height;
Width = width;
Depth = 32;
}
jpegの場合はすでにlibjpegというライブラリがあり、pngの場合はlibpngがあります。幸いなことに、それらはすぐにコンパイルされるため、ターゲット マシンは dll ファイルなどを必要としません。悪いニュースは、それらが C にあることです :(
また、ファイルを自分で読み取ろうと は考えないでください。読みやすい形式が必要な場合は、代わりにPPMを使用してください。
残念ながら、jpeg 形式は圧縮されているため、個々のピクセルを読み取る前に解凍する必要があります。これは重要なタスクです。ライブラリを使用できない場合は、ライブラリを参照して、画像がどのように解凍されているかを確認することをお勧めします。sourceforge にはオープンソース ライブラリがあります: sourceforge のCImg です。
Nils が指摘したように、JPEG 圧縮と画像操作のための C または C++ 標準ライブラリのようなものはありません。
サードパーティのライブラリを使用できる場合は、JPEG、PNG、およびその他の数十の形式、圧縮、およびメディアをサポートするGDALを試してください。
以下は、GDAL C++ API を使用して JPEG ファイルからピクセル データを読み取る方法を示す簡単な例です。
#include <gdal_priv.h>
#include <cassert>
#include <iostream>
#include <string>
#include <vector>
int main()
{
GDALAllRegister(); // once per application
// Assume 3-band image with 8-bit per pixel per channel (24-bit depth)
std::string const file("/home/mloskot/test.jpg");
// Open file with image data
GDALDataset* ds = static_cast<GDALDataset*>(GDALOpen(file.c_str(), GA_ReadOnly));
assert(0 != ds);
// Example 1 - Read multiple bands at once, assume 8-bit depth per band
{
int const ncols = ds->GetRasterXSize();
int const nrows = ds->GetRasterYSize();
int const nbands = ds->GetRasterCount();
int const nbpp = GDALGetDataTypeSize(GDT_Byte) / 8;
std::vector<unsigned char> data(ncols * nrows * nbands * nbpp);
CPLErr err = ds->RasterIO(GF_Read, 0, 0, ncols, nrows, &data[0], ncols, nrows, GDT_Byte, nbands, 0, 0, 0, 0);
assert(CE_None == err);
// ... use data
}
// Example 2 - Read first scanline by scanline of 1 band only, assume 8-bit depth per band
{
GDALRasterBand* band1 = ds->GetRasterBand(1);
assert(0 != band1);
int const ncols = band1->GetXSize();
int const nrows = band1->GetYSize();
int const nbpp = GDALGetDataTypeSize(GDT_Byte) / 8;
std::vector<unsigned char> scanline(ncols * nbpp);
for (int i = 0; i < nrows; ++i)
{
CPLErr err = band1->RasterIO(GF_Read, 0, 0, ncols, 1, &scanline[0], ncols, 1, GDT_Byte, 0, 0);
assert(CE_None == err);
// ... use scanline
}
}
return 0;
}
より完全なGDAL API チュートリアルが利用可能です。
露出を使用する可能性があるため、調査する別のライブラリについて言及します。それは、 SourceforgeでホストされているIM Toolkitです。これはクロス プラットフォームであり、ファイル形式をユーザーから完全に抽象化するため、ほとんどの詳細を気にせずに画像を読み込んで処理できます。デフォルトで PNG と JPEG の両方をサポートしており、必要に応じて他のインポート フィルタで拡張できます。
画像処理演算子の大規模なコレクションも付属しています...
また、 Luaへの高品質のバインディングも備えています。
速度が問題にならない場合は、 PNG の読み込みと保存に非常に最小限のアプローチをとるLodePNGを試すことができます。
または、関数内の自己完結型の png ローダーである同じ作成者の picoPNG を使用することもできます。
他の回答では、ライブラリを使用する必要がある可能性が最も高いと既に述べているため、ImageMagickを見て、必要なことを実行できるかどうかを確認してください。利用可能なほぼすべてのプログラミング言語のライブラリを含む、ImageMagick のコア機能とインターフェイスするためのさまざまな方法が付属しています。
ホームページ: ImageMagick
私はDevILライブラリで良い経験をしました。幅広い画像形式をサポートし、OpenGL と非常によく似た関数スタイルに従います。
確かに、これはライブラリですが、試してみる価値は間違いなくあります。