Rを使用して、いくつかのブログからいくつかの情報を取得しようとしています。取得したいデータは次のとおりです。
1) Date posted
2) Blog Post Title
3) Number of Comments
4) Number of Facebook likes.
このブログには、私が収集しようとしているすべてのフィールドがあります。
理想的には、次のようなデータフレームが必要です。
Post_Date CommentCount FB_Likes Title
2012-12-05 1 629 The James and Claudia Kripalu Workshop– The Daily Practice: Finding Success From Within
... ... ... ...
Rでこれを行う方法はありますか?それはできるかもしれない何かのように思えますRCurl
が、私はあまり精通していませんhtml/xml/js/etc
。
これまでのところ、これは私が持っているものです:
library(RCurl)
library(XML)
xmlTreeParse(getURI("http://www.jamesaltucher.com"))
これを実行すると、開き角かっこと閉じかっこが一致しないというエラーが発生します。
注:これらは私のブログではないため、ブログまたはそのFBアカウントへの管理者アクセス権がありません。