一部のデータセットでいくつかの変換を行っており、健全な形式に公開する必要があります。現在、describe を実行すると、最終的なセットは次のようになります。
{memberId: long,companyIds: {(subsidiary: long)}}
次のようにする必要があります。
{memberId: long,companyIds: [long] }
companyIds
long 型の ID の配列のキーはどこですか?
このように物事を操作する方法に本当に苦労していますか?何か案は?FLATTEN
およびその他のコマンドを使用して、有用性を確認してみました。AvroStorage を使用して、ファイルをこのスキーマに書き込みます。
このデータを書き込む必要があるフィールド スキーマは次のようになります。
"fields": [
{ "name": "memberId", "type": "long"},
{ "name": "companyIds", "type": {"type": "array", "items": "int"}}
]