1

make.output.format を使用した avro 出力形式のサンプル実装では、「バイト」をスキーマとして使用します。代わりに、json スキーマを avro ファイルに指定します。これを行う方法が見つかりませんでした。これを定義する backend.parameters がいくつかあると思います。

avro.output.format =
  function(kv, con)
    writeLines(
      unlist(
        rmr2:::reduce.keyval(
          kv,
          function(k, v)
            paste(
              toJSON(k, .escapeEscapes = TRUE),
              toJSON(v, .escapeEscapes = TRUE),
              sep = "\t"))),
      con = con)

avroOF =
  make.output.format(
    format = avro.output.format,
    mode = "text",
    streaming.format = "org.apache.avro.mapred.AvroTextOutputFormat",
    backend.parameters =
      list(
        hadoop =
          list(
            libjars = avro.jar)))
4

0 に答える 0