r - 列がめちゃくちゃになっているファイルを読み取る方法は?

翻译自：https://stackoverflow.com/questions/16956574 2013-06-06T07:53:17.423

92 次

「\t」で区切られたデータファイルは次のようになります。

Hotel       Price   Location
hotel1      100       A
hotel2      Unknown   B
hotel3      1,200     C
hotel4      <id=?h    B

「価格」列の一部の数字にカンマが含まれており、「1,200」のようになっています。一部の行の「価格」列がめちゃくちゃになっていて、「不明」または「\t」や特定のパターンのない何かが含まれています。

このファイルを読んで、「価格」がめちゃくちゃな行をすべて削除し、数字のすべてのコンマを削除するにはどうすればよいですか? 私が取得したいのは次のとおりです。

Hotel       Price   Location
hotel1      100     A
hotel3      1200    C

使ってみました

price <- read.table("hotel.txt", header=TRUE, colClasses=c("Price"="integer"))

scan() は「整数」を期待していたが、整数ではないものを取得したため、機能していません。

誰でも助けることができますか？

前もって感謝します。

1 に答える 1