python - Python を使用して DataFrame を InfluxDB に挿入する際の問題

翻译自：https://stackoverflow.com/questions/46575210 2017-10-04T22:38:11.617

1395 次

非常に大きな CSV ファイルを InfluxDB に挿入しようとしており、Python でそのように挿入しています。

influx_pd = influxdb.DataFrameClient(host, port, user, password, db, verify_ssl=False)

for frame in pd.read_csv(infile, chunksize=batch_count):
    frame.set_index(pd.DatetimeIndex(frame[date_pk]), inplace=True)
    frame.dropna(axis=1, how='all')
    influx_pd.write_points(frame, 'patients')

ただし、write_points の最初の呼び出しで、次のエラーが表示されます (切り捨てられます):

raise InfluxDBClientError(response.content, response.status_code)
influxdb.exceptions.InfluxDBClientError: 400: {"error":"unable to parse 'enroll_pd Pt Id=\"21.0\",Admit Date=\"2010-12-05\", ... MRSA Screening=\"Negative\" 1291507200000000000': invalid field format\nunable to parse ... (ellipses used to truncate)

InfluxDB と NaN 値 (私の CSV ファイルには含まれています) に関する問題について読んだことがあるので、NaN 値のプレースホルダー値を挿入しようとしましたが、同じ結果が得られました。誰かが私のコードで問題を見つけるのを手伝ってくれませんか? それは大歓迎です。

参考までに、InfluxDB 1.3 Docker イメージを使用しています。

python - Python を使用して DataFrame を InfluxDB に挿入する際の問題

1 に答える 1

Related

Reference