r - 乱雑なメモ帳のデータを整理する

Question

メモ帳にめちゃくちゃなデータがあります。基本的に、異なるデータを保持する異なる列の間にスペースはありません。データのスペースを知っています。たとえば、列 1 ～ 2 は X、列 7 ～ 10 は Y です。

どうすればこれを整理できますか? Rでできますか？これを行う最善の方法は何ですか？

score 1 · Accepted Answer

?read.fwfこの状況では良い賭けかもしれません。

ファイルへのパスを設定します。

temp <- "\pathto\file.txt"

次に、以下に示すように、ファイル内の変数の幅を設定します。

#1-2 = x, 3-10=y
widths <- c(2,8)

次に、列の名前を設定します。

cols <- c("X","Y")

最後に、データをセッションの新しい変数にインポートします。

dataset <- read.fwf(temp,widths,header=FALSE,col.names=cols)

score 0 · Accepted Answer

そのような混乱を処理するために過去に行ったことは、実際に区切り幅のテキストとしてExcelにインポートしてから、CSVとして保存することです。

あなたへの提案です。それが1回限りのプロジェクトであれば、それで問題ありません。コーディングは一切ありません。しかし、それが繰り返し犯罪者である場合は...正規表現を見ることができます。

つまり、^(.{6})(.{7})(.{2})(.{5})$ は、6、7、2、および 5 文字幅の 4 つのフィールドを順番に表します。

2 に答える 2