さまざまな Web サイトからインデックス構成をダウンロードできるパッケージ/方法を探しています。インデックスの構成はめったに変更されず、簡単に入手できますが、オンラインで入手できる csv が見つかりません。
どうすればCAC 40定義を読み込むことができますか?
PS: 私が気にしているのは、名前/isin/sicovam であり、実際にはインデックスの重みではありません
ウィキペディアでCAC40の構成を確認し、パッケージをダウンロードして処理することができますXML
。
この関数readHTMLTable()
は、ページ上のすべてのテーブルを見つけて解析するため、特に便利です。この場合、関連するテーブルは 2 番目であるため、[[2]]
コード内のインデックスです。試す:
library(XML)
url <- "http://en.wikipedia.org/wiki/CAC_40"
dat <- readHTMLTable(url)[[2]]
head(dat[, 1:3])
Company ICB Sector Ticker symbol
1 Accor hotels AC
2 Air Liquide commodity chemicals AI
3 Alstom industrial machinery ALO
4 ArcelorMittal steel MT
5 AXA full line insurance CS
6 BNP Paribas banks BNP
同じコードが FTSE 100 でも機能します。
url <- "http://en.wikipedia.org/wiki/FTSE_100_Index"
dat <- readHTMLTable(url)[[2]]
head(dat[, 1:3])
Company Sector Market cap (£bn)
1 Royal Dutch Shell Oil and gas 135
2 HSBC Banking 129
3 BP Oil and gas 85
4 Vodafone Group Telecomms 83
5 GlaxoSmithKline Pharmaceuticals 73
6 British American Tobacco Tobacco 69