0

CSSで実行できる無関係なタグがたくさんある古いhtmlを解析しようとしています- <b><font>など。Hpricotを使用して解析していますが、最も内側の「inner_html」を取得したいのですが、どうすればよいですか。 Hpricotでそれをしますか?たとえば、Hpricotを使用して、<table>ループするすべての要素を取得して行とセルを取得するとしますが、セル内のデータを取得したいのですが、追加のタグなどを含めることはできません<b><font ...>1,000</font></b>-トリックはありますか「1,000」だけを出しますか?

ありがとう、
ベン

4

1 に答える 1

1

これが完全にあなたの望むものかどうかはわかりませんが、inner_textメソッドを見てみるとよいでしょう。すべての HTML 要素が削除されることを除いて、inner_html と同じものを返します。

于 2010-10-09T03:13:30.157 に答える