make.output.format を使用した avro 出力形式のサンプル実装では、「バイト」をスキーマとして使用します。代わりに、json スキーマを avro ファイルに指定します。これを行う方法が見つかりませんでした。これを定義する backend.parameters がいくつかあると思います。
avro.output.format =
function(kv, con)
writeLines(
unlist(
rmr2:::reduce.keyval(
kv,
function(k, v)
paste(
toJSON(k, .escapeEscapes = TRUE),
toJSON(v, .escapeEscapes = TRUE),
sep = "\t"))),
con = con)
avroOF =
make.output.format(
format = avro.output.format,
mode = "text",
streaming.format = "org.apache.avro.mapred.AvroTextOutputFormat",
backend.parameters =
list(
hadoop =
list(
libjars = avro.jar)))