4

私のデータはVARCHARフォーマットされています。この配列の両方の要素を分割して、JSON からキー値を抽出できるようにします。

データ形式

[
  {
    "skuId": "5bc87ae20d298a283c297ca1",
    "unitPrice": 0,
    "id": "5bc87ae20d298a283c297ca1",
    "quantity": "1"
  },
  
{
    "skuId": "182784738484wefhdchs4848",
    "unitPrice": 50,
    "id": "5bc87ae20d298a283c297ca1",
    "quantity": "4"
  },
]

たとえばskuid、上記の列から抽出したいとします。したがって、抽出後のデータは次のようになります。

1 5bc87ae20d298a283c297ca1
2 182784738484wefhdchs4848

配列へのキャストも機能しません:

SELECT CAST(col AS ARRAY)

次のエラーが発生します。

不明なタイプ: 配列

そのため、配列のネストを解除できません。

Presto Athenaでこの問題を解決するにはどうすればよいですか?

4

1 に答える 1

8

値を JSON として解析し、それを構造化された SQL 型 (配列/マップ/行) にキャストし、UNNEST WITH ORDINALITYを組み合わせて使用​​して、配列から要素を個別の行として抽出できます。これは、JSON ペイロードの配列要素に末尾のコンマがない場合にのみ機能することに注意してください。あなたの例には1つありますが、以下の例から削除されています。

WITH data(value) AS (VALUES
 '[
    {
      "skuId": "5bc87ae20d298a283c297ca1",
      "unitPrice": 0,
      "id": "5bc87ae20d298a283c297ca1",
      "quantity": "1"
    },
    {
      "skuId": "182784738484wefhdchs4848",
      "unitPrice": 50,
      "id": "5bc87ae20d298a283c297ca1",
      "quantity": "4"
    }
  ]'
),
parsed(entries) AS (
  SELECT cast(json_parse(value) AS array(row(skuId varchar)))
  FROM data
)
SELECT ordinal, skuId
FROM parsed, UNNEST(entries) WITH ORDINALITY t(skuId, ordinal)

生成:

 ordinal |          skuId
---------+--------------------------
       1 | 5bc87ae20d298a283c297ca1
       2 | 182784738484wefhdchs4848
(2 rows)
于 2019-05-16T20:32:49.470 に答える