0

こんにちは、私はこの機能を動作させることができません....

ウェブページで:

http://www.meetup.com/stats-prog-dc/members/?sort=chapter_member.atime&desc=1&offset=3

たとえば、memName クラスとのリンクがあります。

<a href="http://www.meetup.com/stats-prog-dc/members/94995702/" class="memName">Asuri</a>

R では、次のコマンドを入力します。

>web <- getURL("http://www.meetup.com/stats-prog-dc/members/?sort=chapter_member.atime&desc=1&offset=3", ssl.verifypeer = FALSE)
>webhtml <- htmlTreeParse(web,error=function( ...){},useInternalNodes=TRUE,encoding="UTF-8",trim=TRUE)
>vNames <- xpathSApply(webhtml,'//*[@class="memName "]', xmlValue)
>vNames

問題は、vNames が「Asuri」と他のすべての名前を含むリストではなく、「list()」を返すことです。なぜそれが機能しないのですか、これは私を殺しています.Rのヘルプはとても不明確です.

htmlTreeParse(web) に引数を入れないと xpathSApply がエラーを返すのはなぜですか? xpathSApply の引数 xmlValue は何ですか?ヘルプページにも言及されていません!

4

1 に答える 1

2

属性名にスペースを追加しました。使用する

xpathSApply(webhtml,'//*[@class="memName"]', xmlValue)

 [1] "James Conkling"     "Mary Clare Peate"   "Mike Hodel"        
 [4] "Harlan Harris"      "kenny"              "Alex McKenzie"     
 [7] "KJ"                 "shaema talib"       "Brian Sacash"      
[10] "fbohorqu"           "Peter"              "Steve Swartz"      
[13] "Russell"            "J. Kader Hyer"      "T Woo"             
[16] "Rajavel Sethupathi" "Clarence Dillon"    "Patrick Wheatley"  
[19] "Anna Shaver"        "anupam"     

代わりは。

xmlValue特定のノードの値を提供します。?xmlValueヘルプページを表示します。関数が各ノードに適用されるxpathSApplyパラメータがあります。たとえば、特定のノードの属性が必要な場合にfun使用できます。xmlAttrs

> xpathSApply(webhtml,'//*[@class="memName"]',xmlAttrs)
      [,1]                                                   
href  "http://www.meetup.com/stats-prog-dc/members/37625662/"
class "memName"                                              
      [,2]                                                   
href  "http://www.meetup.com/stats-prog-dc/members/94691152/"
class "memName"                                              
      [,3]                                                   
href  "http://www.meetup.com/stats-prog-dc/members/91583452/"
class "memName"                                              
于 2013-05-28T01:20:21.240 に答える