Nokogiri を使用して HTML を分析していますが、ノード内の生の HTML を取得する方法がわかりません。
たとえば、次のようになります。
<tr class="tableX">
<td align="center">
<font size="2"><a href="javascript:open('9746')">9746</a></font>
</td>
<td align="center">
<font size="2">2012-06-26</font>
</td>
</tr>
この XPath セレクターを使用すると、次のようになります。
doc = Nokogiri::HTML(html)
nodes = doc.search("//tr[@class='tablebX']")
nodes.each do |node|
node.text # or node.content
end
node.text
との結果は次のnode.content
とおりです。
9746
2012-06-26
tr
ブロック内の生の HTML をすべて取得したいのですが、この場合は次のようになります。
<td align="center">
<font size="2"><a href="javascript:open('9746')">9746</a></font>
</td>
<td align="center">
<font size="2">2012-06-26</font>
</td>
それを行う適切な方法は何ですか?