0

Hpricot を使用して、ページ上のすべての画像から代替テキストを取得しようとしていますが、その方法がわかりません。

誰もこれを以前にやったことがありますか?

ありがとう!デニス

4

1 に答える 1

2

Hpricotを使うのは初めてなので、お手柔らかに。これにより、あなたが求めていたデータが分離されると思います。

require 'rubygems'
require 'hpricot'

page = "<html><body><p>Create a link of an image:<a href=\"default.asp\"><img src=\"smiley.gif\" alt=\"alt_text_1\" width=\"32\" height=\"32\" /></a></p><p>No border around the image, but still a link:<a href=\"default.asp\"><img border=\"0\" src=\"smiley.gif\" alt=\"alt_text_2\" width=\"32\" height=\"32\" /></a></p></body></html>"
doc = Hpricot(page)

doc.search("//img").each do |img|
    puts img.attributes['alt']
end

出力は次のようになります。

#=> alt_text_1
#=> alt_text_2
于 2010-11-05T20:18:51.897 に答える