0

私はセレリティを使用して画面のスクレイピングを行っていますが、太字のテキスト要素を識別する必要があります。セレリティは強力な方法を提供しますが、大胆な方法を提供しません。セレリティや他のツールを使って、これを回避する賢い方法を誰かが考え出したことがありますか。私は使ってみました:

browser.html.gsub!(<b>,<strong>)
browser.html.gsub!(</b>,</strong>)

太字の要素を強力な要素に置き換えて、セレリティの強力な方法を使用することはできましたが、これはうまくいかなかったようです。

よろしくお願いします。

4

1 に答える 1

1

bが欠落しているのは奇妙に思えますが、次のことを試すことができます。

browser.elements_by_xpath('//b').each do |b|
    puts "#{b} is a bold tag"
end
于 2012-03-11T02:54:08.410 に答える