カスタム データ ソース (プロパティ ファイル) 用に spark(1.5.2) sql RelationProvider を実装しています。
自動推論アルゴリズムの実装方法を説明してください。
カスタム データ ソース (プロパティ ファイル) 用に spark(1.5.2) sql RelationProvider を実装しています。
自動推論アルゴリズムの実装方法を説明してください。
StructType
一般に、スキーマを表すを作成する必要があります。AStructType
にはArray[StructField]
、配列の各要素がスキーマの列に対応する が含まれます。Aは、ネストされたスキーマの別のものを含めStructField
、サポートされている任意のものです。DataType
StructType
スキーマの作成は次のように簡単です。
val schema = StructType(Array(
StructField("col1", StringType),
StructField("col2", LongType)
))
ネストされたものを含む複雑なデータセットからスキーマを生成する場合はStructTypes
、再帰関数を作成する必要があります。そのような関数がどのように見えるかの良い例は、spark-avro
統合ライブラリにあります。関数toSqlTypeはAvro
スキーマを受け取り、それを Spark に変換しますStructType
。