-3

さまざまな Web サイトからインデックス構成をダウンロードできるパッケージ/方法を探しています。インデックスの構成はめったに変更されず、簡単に入手できますが、オンラインで入手できる csv が見つかりません。

どうすればCAC 40定義を読み込むことができますか?

PS: 私が気にしているのは、名前/isin/sicovam であり、実際にはインデックスの重みではありません

4

1 に答える 1

3

ウィキペディアでCAC40の構成を確認し、パッケージをダウンロードして処理することができますXML

この関数readHTMLTable()は、ページ上のすべてのテーブルを見つけて解析するため、特に便利です。この場合、関連するテーブルは 2 番目であるため、[[2]]コード内のインデックスです。試す:

library(XML)
url <- "http://en.wikipedia.org/wiki/CAC_40"
dat <- readHTMLTable(url)[[2]]

 head(dat[, 1:3])
        Company           ICB Sector Ticker symbol
1         Accor               hotels            AC
2   Air Liquide  commodity chemicals            AI
3        Alstom industrial machinery           ALO
4 ArcelorMittal                steel            MT
5           AXA  full line insurance            CS
6   BNP Paribas                banks           BNP

同じコードが FTSE 100 でも機能します。

url <- "http://en.wikipedia.org/wiki/FTSE_100_Index"
dat <- readHTMLTable(url)[[2]]
head(dat[, 1:3])
                   Company          Sector Market cap (£bn)
1        Royal Dutch Shell     Oil and gas                 135
2                     HSBC         Banking                 129
3                       BP     Oil and gas                  85
4           Vodafone Group       Telecomms                  83
5          GlaxoSmithKline Pharmaceuticals                  73
6 British American Tobacco         Tobacco                  69
于 2013-07-29T14:25:09.520 に答える