3

エラーで失敗するジョブがあります

行:14222274 / フィールド:1、不正な文字 (ASCII 0) が検出されました。ファイルの残りは処理されません。

データは圧縮されており、ファイルに ASCII 0 文字が存在しないことを確認しました。ファイルには 14222273 行しかないため、エラー メッセージに出力される行番号は、ファイルの末尾の 1 行後です。正常にアップロードされた同じデータ セットからの他のチャンクがあるため、これは BQ のバグであるか、エラー メッセージが根本的な問題を示していない可能性があります。この問題を解決する助けをいただければ幸いです。ありがとう。

>>> data = open("data.csv").read()
>>> chr(0) in data
False
>>> data[-1]
'\n'
4

3 に答える 3

1

圧縮するとき、どのユーティリティを使用しましたか?

csv ファイルを ZIP 形式 (Windows) で圧縮したときに、この問題が発生しました。Google BigQuery は gzip 形式しか受け付けないようです。

gzip を使用して CSV を圧縮してください。Windows 7を使用している場合、-zip は gzip で圧縮できる優れたユーティリティです。

Unix では gzip が標準です。

于 2012-06-14T23:38:20.617 に答える
0

不正な文字 (ASCII 0) が検出されました。ファイルの残りは処理されません。

デコードできないUTF-16文字があることを明確に示しています。BigQuery サービスは、UTF-8 と latin1 のテキスト エンコーディングのみをサポートしています。したがって、ファイルは UTF-8 でエンコードされているはずです。

ファイルには 14222273 行しかないため、エラー メッセージに出力される行番号は、ファイルの末尾の 1 行後です。

おそらく、ファイルの末尾に UTF-16 でエンコードされたタブ文字があり、デコードできません。


解決策:コマンドで-aor--asciiフラグを使用しgzipます。によって正常にデコードされますbigquery

于 2016-09-01T09:49:54.707 に答える