私は R コーディング (または一般的なコーディング) の初心者で、ブラジルの Web サイトから大量の価格を読み込もうとしています。
http://www.muffatosupermercados.com.br/Home.aspx
ページを開くと、"CURITIBA" が必要な都市を選択するフォームが表示されます。
Chrome で Cookie を開くと、次のようになります。
名前: CidadeSelecionada コンテンツ: CidadeId=55298&NomeCidade=CURITIBA&FilialId=53
私のコードは、このリンクから価格を取得することです: " http://www.muffatosupermercados.com.br/CategoriaProduto.aspx?Page=1&c=2 "
library(httr)
a1 <- "http://www.muffatosupermercados.com.br/CategoriaProduto.aspx?Page=1&c=2"
b2 <- GET(a1,set_cookies(.CidadeSelecionada = c(CidadeId=55298,NomeCidade="CURITIBA",FilialId=53)))
cookies(b2)
これから私が得る唯一の応答はセッションID Cookieです:
$ASP.NET_SessionId [1] "o5wlycpnjbfraislczix1dj4"
ページを読み込もうとすると、空のフォームの背後にあるページのみが表示されます。
html <- content(b2,"text")
writeBin(html, "myfile.txt")
誰もこれを解決する方法について考えを持っていますか? また、RCurlを使用してフォームデータを投稿しようとしましたが、うまくいきませんでした...
別の方法でこれを行おうとしている私の別のスレッドへのリンクがあります: RCurl - フォームを送信してページを読み込む