非常に大きな CSV ファイルを InfluxDB に挿入しようとしており、Python でそのように挿入しています。
influx_pd = influxdb.DataFrameClient(host, port, user, password, db, verify_ssl=False)
for frame in pd.read_csv(infile, chunksize=batch_count):
frame.set_index(pd.DatetimeIndex(frame[date_pk]), inplace=True)
frame.dropna(axis=1, how='all')
influx_pd.write_points(frame, 'patients')
ただし、write_points の最初の呼び出しで、次のエラーが表示されます (切り捨てられます):
raise InfluxDBClientError(response.content, response.status_code)
influxdb.exceptions.InfluxDBClientError: 400: {"error":"unable to parse 'enroll_pd Pt Id=\"21.0\",Admit Date=\"2010-12-05\", ... MRSA Screening=\"Negative\" 1291507200000000000': invalid field format\nunable to parse ... (ellipses used to truncate)
InfluxDB と NaN 値 (私の CSV ファイルには含まれています) に関する問題について読んだことがあるので、NaN 値のプレースホルダー値を挿入しようとしましたが、同じ結果が得られました。誰かが私のコードで問題を見つけるのを手伝ってくれませんか? それは大歓迎です。
参考までに、InfluxDB 1.3 Docker イメージを使用しています。