私のファイルは、csv
コンマ区切りのフィールドを持つファイルです。
最初のフィールドでファイルを複数のファイルに分割しようとしました。私は次のことをしました:
cat myfile.csv | awk -F',' '{print $0 > "Mydata"$1".csv"}'
ファイルは分割されますが、ファイルが破損しており、各ファイルの最後の行が完全ではありません。壊れる位置はランダムに見えます。誰も同じ問題を抱えていますか?
これらのタイプの問題は、入力ファイルを Windows で作成したため、行末に誤った control-M があるため、常に発生します。入力ファイルに対して dos2unix を実行してクリーンアップし、awk コマンドを再実行しますが、次のように書き直します。
awk -F',' '{print > ("Mydata" $1 ".csv") }' myfile.csv
いくつかの無関係な問題を解決します。
次の awk コマンドを使用して、\r
の前の文字を無視し\n
ます。
awk -F ',' -v RS='\r\n' '{print > ("Mydata" $1 ".csv") }' myfile.csv