いくつかの奇妙な区切りでデータを表にしました (つまり、コンマで区切られた値のグループ、タブで他の値から区切られた):
A,345,567 56 67 test
csv module、numpy.genfromtxt、またはnumpy.loadtxtのいずれかで複数の区切り記号を処理するクリーンで賢い方法はありますか?
このような方法を見つけましたが、より良い解決策があることを願っています。理想的には、区切り文字に genfromtxt と正規表現を使用したいと思います。
いくつかの奇妙な区切りでデータを表にしました (つまり、コンマで区切られた値のグループ、タブで他の値から区切られた):
A,345,567 56 67 test
csv module、numpy.genfromtxt、またはnumpy.loadtxtのいずれかで複数の区切り記号を処理するクリーンで賢い方法はありますか?
このような方法を見つけましたが、より良い解決策があることを願っています。理想的には、区切り文字に genfromtxt と正規表現を使用したいと思います。
あなたが求めた3つのパッケージには答えがないのではないかと思います。ただし、実行することはできますreplace('\t', ',')
(またはその逆)。例えば:
from StringIO import StringIO # py3k: from io import StringIO
import csv
with open('./file') as fh:
io = StringIO(fh.read().replace('\t', ','))
reader = csv.reader(io)
for row in reader:
print(row)