1

「\t」で区切られたデータ ファイルは次のようになります。

Hotel       Price   Location
hotel1      100       A
hotel2      Unknown   B
hotel3      1,200     C
hotel4      <id=?h    B

「価格」列の一部の数字にカンマが含まれており、「1,200」のようになっています。一部の行の「価格」列がめちゃくちゃになっていて、「不明」または「\t」や特定のパターンのない何かが含まれています。

このファイルを読んで、「価格」がめちゃくちゃな行をすべて削除し、数字のすべてのコンマを削除するにはどうすればよいですか? 私が取得したいのは次のとおりです。

Hotel       Price   Location
hotel1      100     A
hotel3      1200    C

使ってみました

price <- read.table("hotel.txt", header=TRUE, colClasses=c("Price"="integer"))

scan() は「整数」を期待していたが、整数ではないものを取得したため、機能していません。

誰でも助けることができますか?

前もって感謝します。

4

1 に答える 1