Hadoopで画像をAvro形式に変換することは可能ですか?
質問する
776 次
1 に答える
1
Avroは、プラットフォームに依存しない方法(「データシリアル化システム」)であるデータスキーマを記述するために使用されます。
画像自体はさまざまな形式(PNG、JPEG、BMP、GIFなど)でエンコードでき、それらはすべてバイトのシーケンスとして表すことができます。さらに、画像に関するメタデータを定義することもできます(とにかくバイトでエンコードされている可能性がありますが、ユースケースによっては画像を抽出すると便利な場合があります。
プリミティブスキーマは次のようになります(ドキュメントから採用)。
{"namespace": "example.avro",
"type": "record",
"name": "Image",
"fields": [
{"name": "filename", "type": "string"},
{"name": "type", "type": "string"},
{"name": "data", "type": "bytes"},
{"name": "width", "type": "int"},
{"name": "height", "type": "int"}
]
}
于 2013-01-08T01:12:39.867 に答える