「\t」で区切られたデータ ファイルは次のようになります。
Hotel Price Location
hotel1 100 A
hotel2 Unknown B
hotel3 1,200 C
hotel4 <id=?h B
「価格」列の一部の数字にカンマが含まれており、「1,200」のようになっています。一部の行の「価格」列がめちゃくちゃになっていて、「不明」または「\t」や特定のパターンのない何かが含まれています。
このファイルを読んで、「価格」がめちゃくちゃな行をすべて削除し、数字のすべてのコンマを削除するにはどうすればよいですか? 私が取得したいのは次のとおりです。
Hotel Price Location
hotel1 100 A
hotel3 1200 C
使ってみました
price <- read.table("hotel.txt", header=TRUE, colClasses=c("Price"="integer"))
scan() は「整数」を期待していたが、整数ではないものを取得したため、機能していません。
誰でも助けることができますか?
前もって感謝します。