0

ウェブサイトからいくつかの製品の価格を廃棄しています。Pythonでは問題なくurllib2を使用しましたが、RIでRCurlを使用しようとすると、ソースコードをダウンロードできませんでした。

ソースコードと製品コードを貼り付けて、価格を把握する必要があります。製品のパスは次のとおりです:http://www.americanas.com.br/produto/code_of_product

実は、RCurlを使った製品のソースコードをダウンロードできません。たとえばgetURL(' http://www.americanas.com.br/produto/111467594 ')を試してみると、「」が返されます。

getURL('... / produtos / 111467594')を使用してソースをダウンロードできましたが、この方法では価格を取得できません。:(

どうすれば製品の価格を入手できるか知っている人はいますか?

ありがとう。

追伸:英語が下手でごめんなさい。:)

4

1 に答える 1

2

StackOverflowへようこそ。

なぜそれが機能しないのか私にはわかりませんが、にを含めてもらえますverbose=TRUEgetURL?また、リンクしたWebページの価格が異なることに気付きました。あなたはすべてまたは最初だけが欲しいですか?「ポー価格」を取得するには、これはどうですか。

library("stringr")

productwebpage<-readLines("http://www.americanas.com.br/produto/111467594")
pricerow<-productwebpage[grep("p class=\"sale price\"",productwebpage)] 
price<-str_extract_all(pricerow,"\\(?[0-9,.]+\\)?")[[1]]

(「deprice」 /古い価格を取得するため)または(「semjouros」価格/月額支払いを取得するため)のgrep("p class=\"sale price\"",productwebpage)いずれかに置き換えることもできます。最後の例では、最初に月を受け取り、その後に支払いを受け取るので、次のようになります。grep("<p><span class=\"regular price\">",productwebpage)grep("<span class=\"p-v interest\">",productwebpage)

> price
[1] "12"    "83,25"

これは他の製品でもうまくいくはずです(5を試しただけで、すべての製品で機能するようです)。

于 2013-02-17T17:11:46.783 に答える