メモ帳にめちゃくちゃなデータがあります。基本的に、異なるデータを保持する異なる列の間にスペースはありません。データのスペースを知っています。たとえば、列 1 ~ 2 は X、列 7 ~ 10 は Y です。
どうすればこれを整理できますか? Rでできますか?これを行う最善の方法は何ですか?
メモ帳にめちゃくちゃなデータがあります。基本的に、異なるデータを保持する異なる列の間にスペースはありません。データのスペースを知っています。たとえば、列 1 ~ 2 は X、列 7 ~ 10 は Y です。
どうすればこれを整理できますか? Rでできますか?これを行う最善の方法は何ですか?
?read.fwf
この状況では良い賭けかもしれません。
ファイルへのパスを設定します。
temp <- "\pathto\file.txt"
次に、以下に示すように、ファイル内の変数の幅を設定します。
#1-2 = x, 3-10=y
widths <- c(2,8)
次に、列の名前を設定します。
cols <- c("X","Y")
最後に、データをセッションの新しい変数にインポートします。
dataset <- read.fwf(temp,widths,header=FALSE,col.names=cols)
そのような混乱を処理するために過去に行ったことは、実際に区切り幅のテキストとしてExcelにインポートしてから、CSVとして保存することです。
あなたへの提案です。それが1回限りのプロジェクトであれば、それで問題ありません。コーディングは一切ありません。しかし、それが繰り返し犯罪者である場合は...正規表現を見ることができます。
つまり、^(.{6})(.{7})(.{2})(.{5})$ は、6、7、2、および 5 文字幅の 4 つのフィールドを順番に表します。