datファイルには、実際のデータの前に数行の追加情報があります。引数でそれらをスキップしskip
ます:
read.table("http://www.nilu.no/projects/ccc/onlinedata/ozone/CZ03_2009.dat",
header=TRUE, skip=3)
データセットに慣れていない場合にこれを確認する簡単な方法は、最初に次のようreadLines
に数行を確認することです。
readLines("http://www.nilu.no/projects/ccc/onlinedata/ozone/CZ03_2009.dat",
n=10)
# [1] "Ozone data from CZ03 2009" "Local time: GMT + 0"
# [3] "" "Date Hour Value"
# [5] "01.01.2009 00:00 34.3" "01.01.2009 01:00 31.9"
# [7] "01.01.2009 02:00 29.9" "01.01.2009 03:00 28.5"
# [9] "01.01.2009 04:00 32.9" "01.01.2009 05:00 20.5"
ここでは、実際のデータがで始まることが[4]
わかります。したがって、最初の3行をスキップすることがわかります。
アップデート
本当にValue
列だけが必要な場合は、次の方法で実行できます。
as.vector(
read.table("http://www.nilu.no/projects/ccc/onlinedata/ozone/CZ03_2009.dat",
header=TRUE, skip=3)$Value)
繰り返しにreadLines
なりますが、インポートする列の実際の名前を把握するのに役立ちます。
しかし、データセット全体を読み込んで後で抽出するよりも、これを行うことの利点はあまりありません。