今日、Kinesis、Firehose、および Redshift の最初の学習ステップを行ったとき、Amazon に「デモ データ プロデューサーを試す」設定があることを発見してうれしく思いました。
実際には機能していないように見えることを知って、私はイライラしました。
ということで、掘りに行ってきました。そしてSTL_LOAD_ERROR
、区切り文字が期待されていることを示唆するエラーが含まれていること、および のように見えるレコードのフロントが見つかりました{field:val,field:val}{field:val,field:val}
。
...{"TICKER_SYMBOL": | 1214 | Delimiter not found
「どこかで改行を削除しているに違いない」と私は思いました。
掘り下げた後、関連する S3 バケットに驚くべき形式で生産記録があることがわかりました。
{field:val,field:val}{field:val,field:val}...
つまり、数十 K の単一行ファイルである見かけのレコード間に区切り文字はありません。
他の SO 投稿は、これが実際に期待されるデータ形式であることを示唆しているようです。
データ デモで使用されていない形式のデータが Redshift に必要なのはなぜですか? どちらを再構成しますか?