amazon-redshift - Kinesis Firehose デモには区切り文字がありません。Redshift はそれなしでは解析できません。どちらが間違っていますか?

Question

今日、Kinesis、Firehose、および Redshift の最初の学習ステップを行ったとき、Amazon に「デモデータプロデューサーを試す」設定があることを発見してうれしく思いました。

実際には機能していないように見えることを知って、私はイライラしました。

ということで、掘りに行ってきました。そしてSTL_LOAD_ERROR、区切り文字が期待されていることを示唆するエラーが含まれていること、およびのように見えるレコードのフロントが見つかりました{field:val,field:val}{field:val,field:val}。

...{"TICKER_SYMBOL": |     1214 | Delimiter not found

「どこかで改行を削除しているに違いない」と私は思いました。

掘り下げた後、関連する S3 バケットに驚くべき形式で生産記録があることがわかりました。

{field:val,field:val}{field:val,field:val}...

つまり、数十 K の単一行ファイルである見かけのレコード間に区切り文字はありません。

他の SO 投稿は、これが実際に期待されるデータ形式であることを示唆しているようです。

データデモで使用されていない形式のデータが Redshift に必要なのはなぜですか? どちらを再構成しますか?

score 1 · Accepted Answer

わかった。3つの問題がありました。

1 に答える 1