read_csv
メソッドを使用して、ファイルからデータを読み込んでデータ フレームを作成する必要があります。ただし、セパレーターはあまり規則的ではありません。タブ ( \t
) で区切られている列もあれば、スペースで区切られている列もあります。さらに、一部の列は、2 つまたは 3 つ以上のスペース、またはスペースとタブの組み合わせ (たとえば、3 つのスペース、2 つのタブ、1 つのスペース) で区切ることができます。
これらのファイルを適切に処理するようにパンダに指示する方法はありますか?
ちなみに、Pythonを使えばこの問題はありません。私が使う:
for line in file(file_name):
fld = line.split()
そして、それは完璧に機能します。フィールド間に 2 つまたは 3 つのスペースがあってもかまいません。スペースとタブの組み合わせでも問題ありません。パンダは同じことができますか?