0

メモ帳にめちゃくちゃなデータがあります。基本的に、異なるデータを保持する異なる列の間にスペースはありません。データのスペースを知っています。たとえば、列 1 ~ 2 は X、列 7 ~ 10 は Y です。

どうすればこれを整理できますか? Rでできますか?これを行う最善の方法は何ですか?

4

2 に答える 2

1

?read.fwfこの状況では良い賭けかもしれません。

ファイルへのパスを設定します。

temp <- "\pathto\file.txt"

次に、以下に示すように、ファイル内の変数の幅を設定します。

#1-2 = x, 3-10=y
widths <- c(2,8)

次に、列の名前を設定します。

cols <- c("X","Y")

最後に、データをセッションの新しい変数にインポートします。

dataset <- read.fwf(temp,widths,header=FALSE,col.names=cols)
于 2012-07-20T02:30:46.363 に答える
0

そのような混乱を処理するために過去に行ったことは、実際に区切り幅のテキストとしてExcelにインポートしてから、CSVとして保存することです。

あなたへの提案です。それが1回限りのプロジェクトであれば、それで問題ありません。コーディングは一切ありません。しかし、それが繰り返し犯罪者である場合は...正規表現を見ることができます。

つまり、^(.{6})(.{7})(.{2})(.{5})$ は、6、7、2、および 5 文字幅の 4 つのフィールドを順番に表します。

于 2012-07-20T00:22:55.313 に答える