1

xml データがファイルで利用可能な場合、以下のリンクで利用できる適切なソリューション https://github.com/databricks/spark-xml

以下のコードは、物理ファイルをロードして xml を DataSet に変換します。

Dataset<Row> df = sqlContext.read().format("com.databricks.spark.xml")
                                   .option("rowTag", "book")
                                   .load("file:///C:/books.xml");

しかし、JavaRdd で xml データが利用可能な場合、データセットに変換する方法は?

4

0 に答える 0