次の形式のtxtファイルがあります(簡略化):
date this that other
2007-05-25 11:00:00 10 20 30
2007-05-25 11:10:00 15 18 30
2007-05-25 11:20:00 10 27 30
2007-05-25 11:30:00 20 35 30
2007-05-25 11:50:00 30 20
2007-05-25 12:00:00 30 13
2007-05-25 12:10:00 30 13
最初の raw は、その上の列を定義する文字列です。最初の列は時間であることは明らかです。一部の値が欠落していることも確認できます。一部の値が欠落している行を消去したくありません。後でそのデータを使用していくつかの計算を行いたいので、numpy を使用してそのデータをインポートすることを考えましたnumpy.loadtxt
。
data = numpy.loadtxt('data.txt')
ValueError: could not convert string to float: b'date'
最初の raw が原因でエラーが発生します。使用:
data = numpy.genfromtxt('data.txt')
Line #51028 (got 38 columns instead of 37)
一部の値が欠落しているため、多くの行でエラーが発生します。何を試してみるべきですか?