Rでいくつかの地震データを分析したいと思います。ソースHTMLの典型的な(多くの)出力は次のようになります。
<pre>
Year,Month,Day,Time(hhmmss.mm)UTC,Latitude,Longitude,Magnitude,Depth,Catalog
2012, 01, 01, 003008.77, 12.008, 143.487, 5.1, 35, PDE-W
.....
</pre>
カンマ区切りのデータを文字列に変換しました。\n行を区切る必要がありますが、さらに先に進む方法がわかりません。とにかく、それが最善の方法かどうかはわかりません。
library(XML)
url <- "http://neic.usgs.gov/cgi-bin/epic/epic.cgi?SEARCHMETHOD=1&FILEFORMAT=6&SEARCHRANGE=HH&SYEAR=2012&SMONTH=01&SDAY=01&EYEAR=2012&EMONTH=1&EDAY=31&LMAG=4&UMAG=&NDEP1=&NDEP2=&IO1=&IO2=&CLAT=0.0&CLON=0.0&CRAD=0.0&SUBMIT=Submit+Search"
data <- xpathSApply(basicInfo, "//*/pre/text()", xmlValue)
str(data) #chr "\n Year,Month,Day, .... Catalog\n 2012,
助けていただければ幸いです