0

解析するHTMLの一部を次に示します。

<td style="text-align:center; color:black; background:#ff6666; border:2px solid #8811ff;"   title="Alkali metals; Primordial; Solid">
37  
<br />  
<a title="Rubidium" href="/wiki/Rubidium">Rb</a>  
</td>`  

で値を取得できますxmlValue。私が得るものは:

text   br    a   
"19"   ""  "K"   

しかし、属性の値を取得したいのですがtd、の属性title「アルカリ金属;原始;固体」a、の属性title「ルビジウム」です。

どうすれば入手できますか?

4

1 に答える 1

3

xmlAttrsorを使用できますxmlGetAttr(詳細については、を参照?xmlAttrsしてください)。

html <- '<td style="text-align:center; color:black; background:#ff6666; border:2px solid #8811ff;" title="Alkali metals; Primordial; Solid">37<br /><a title="Rubidium" href="/wiki/Rubidium">Rb</a></td>'
td <- xmlRoot(xmlParse(html))
xmlAttrs(td)["title"]
# "Alkali metals; Primordial; Solid"
xmlAttrs(xmlChildren(td)$a)["title"]
# "Rubidium

# or
xmlGetAttr(td, "title")
# "Alkali metals; Primordial; Solid"
于 2012-09-02T08:53:02.747 に答える