国が発行する地方債を調査するプロジェクトに取り組んでいますが、データの取得に問題があります。XML パッケージと以下のコードを使用して、その一部を取得できました。
> nys="http://newyork.municipalbonds.com/bonds/issue/649787N87"
> nys.table=readHTMLTable(nys,asText=TRUE,which=4)
> nys.table=as.data.frame(nys.table)
> head(nys.table)
Trade Date Trade Time Maturity Date Coupon Price Yield Trade Amount Trade Type
1 2012-09-27 2:49pm 2013-Apr 5.000% 102.522 0.289 $270,000 Investor bought
2 2012-09-27 1:17pm 2013-Apr 5.000% 102.290 0.712 $45,000 Inter-dealer
しかし、そのサイトは無料で小さなサンプルしか提供していません. 公式サイトの EMMA には無料でデータがありますが、スクレイピングに苦労しています。前と同じアプローチを試みると、最終的には
nys="http://emma.msrb.org/SecurityView/SecurityDetailsTrades.aspx?cusip=649787N87"
nys.table=readHTMLTable(nys,asText=TRUE)
nys.table=as.data.frame(nys.table)
head(nys.table)
data frame with 0 columns and 0 rows
私が理解していることから、そしてこれについてかなり確信しているのは、Web ブラウザーを介してナビゲートすると、標準の T&C ページがあるということです。htmlParse(nys) を使用した後の出力は、データが実際に配置されているページではなく、T&C ページのページ ソース コードと同じです。そのため、コードが実行されると、T&C ページでテーブルを見つけようとします。
これはかなり一般的な問題だと思いましたが、これまでのところ、誰かが同様の問題を抱えている投稿を見つけることができませんでした. 誰かが私を正しい方向に向けることができれば、私は非常に感謝しています.