BigQueryのインポートドキュメントから、
注: Null 値は許可されていません
したがってnull
、BigQuery インポート用の json 形式のデータでは許可されていないと思います。ただし、null
値は通常の ETL タスクでは実際には非常に一般的です (データが欠落しているため)。そのようなjsonソースファイルをインポートするための良い解決策は何ですか? 私のデータにはネストされた構造が含まれていることに注意してください。そのため、値への変換CSV
や使用を好まないことに注意してください。,,
null
私ができると思う1つの方法は、すべてのnull
値をそれぞれ異なるデータ型のデフォルト値に置き換えることです。
- 文字列:
null
-> 空の文字列 - 整数:
null
-> -1 - フロート:
null
-> -1.0 - ...
しかし、私はそれが好きではありません。より良い選択肢を探しています。
bq load
ところで、値を含むjsonファイルを使用しようとしましたnull
。以下のエラーが表示されます。
Failure details:
- Expected '"' found 'n'
- Expected '"' found 'n'
- Expected '"' found 'n'
- Expected '"' found 'n'
- Expected '"' found 'n
...
null
これは使い方の目安だと思いますが、正しいですか?
編集null
:すべてのフィールドを削除すると、うまくいくようです。これがデータの扱い方だと思いnull
ます。データ フィールドを使用することはできませんがnull
、含めることはできません。null
そのため、未加工の json のすべてのフィールドを削除するためのフィルタリング コードが必要です。