15

Nokogiriで次のことをすると:

some_html = '<img src="bleh.jpg"/>test<br/>'
f = Nokogiri::HTML(some_html)
#do some processing
puts f

上部のコードを含む XHTML doc 構造全体を出力します。

some_html変数にあるhtml部分を印刷/取得/取得するにはどうすればよいですか?


いいえ。

f戻ります:

"<!DOCTYPE html PUBLIC \"-//W3C//DTD HTML 4.0 Transitional//EN\" \"http://www
.w3.org/TR/REC-html40/loose.dtd\">\n<html><body>\n<img src=\"bleh.jpg\">test<br>\n
</body></html>\n"

内部/フラグメント部分のみが必要です:

<img src=\"bleh.jpg\">test<br>
4

2 に答える 2

37

Nokogiri::HTML(...)useを使用して解析する代わりにNokogiri::HTML::fragment(...):

asdf = Nokogiri::HTML::fragment('<img src="bleh.jpg">test<br>')
print asdf.to_html
# >> <img src="bleh.jpg">test<br>
于 2009-11-27T05:59:08.947 に答える
0

「html」部分とはどういう意味ですか?

f.text()内部テキストを取得するだけです。

于 2009-11-04T14:48:46.433 に答える