xml データがファイルで利用可能な場合、以下のリンクで利用できる適切なソリューション https://github.com/databricks/spark-xml
以下のコードは、物理ファイルをロードして xml を DataSet に変換します。
Dataset<Row> df = sqlContext.read().format("com.databricks.spark.xml")
.option("rowTag", "book")
.load("file:///C:/books.xml");
しかし、JavaRdd で xml データが利用可能な場合、データセットに変換する方法は?