3

このページ(http://hk.ishares.com/product_info/fund/overview/SEHK/2836.htm)に移動し、[NAV /インデックス履歴]リンク([市場情報]の下)をクリックしてCSVをダウンロードします。ファイルの場合、そのファイルの内容は英語です。ただし、次のコマンドを使用してRを介して同じことを実行しようとすると、内容は中国語になります。

download.file("http://hk.ishares.com/product_info/fund/excel_histoverview.htm?ticker=2836", destfile="2836.csv")
a <- read.csv("2836.csv", skip = 5)
> head(a)
            日期 指數收市水平..HKD. 單位資產淨值 總派息.每股...HKD.
1 2013年03月18日          3666.9390      15.7774                  0
2 2013年03月15日          3701.3143      15.9145                  0
3 2013年03月14日          3709.7446      15.9484                  0
4 2013年03月13日          3668.3178      15.8762                  0
5 2013年03月12日          3707.0364      15.9726                  0
6 2013年03月11日          3716.4011      16.0521                  0

おそらく、WebサイトがブラウザのCookieを認識し、英語版のファイルを配信しているためですが、Rを通過したときはそうではありません。

これを回避する方法はありますか?中国の日付をDateオブジェクトに変換する方法がわからないため、CSVファイルをXTSに変換するのが困難になっています。

ありがとうございました。

4

1 に答える 1

4

httr ライブラリがインストールされていると仮定して、これを試してください:

library(httr)

# Get cookies from English page
en_page <- GET("http://hk.ishares.com/product_info/fund/overview/SEHK/2836.htm?ls=true&l=en")

# Get the data
data <- GET("http://hk.ishares.com/product_info/fund/excel_histoverview.htm?ticker=2836",
        set_cookies(en_page$cookies[[1]]))

# Load into a data.frame
a <- read.csv(textConnection(content(data)), skip = 5)

head(a)

基本的に、英語のページから Cookie を取得し、それらを使用してリクエストを送信します。

于 2013-03-19T11:17:23.107 に答える