私はタグを持っています:
val = "<a href=\"https://mobile.twitter.com\" rel=\"nofollow\">Mobile Web</a>"
私のテストでは:
val[/(>.*<)/]
リターン:
>Mobile Web<
テキストを返したい:
Mobile Web
Nokogiriで解析できます:
require 'nokogiri'
html = '<a href="https://mobile.twitter.com" rel="nofollow">Mobile Web</a>'
elem = Nokogiri(html)
puts elem.text
match を使用して、括弧で必要な部分を選択できます
/>(.*)</.match(val)[1]
html 解析には hpricot や nokogiri などの html 解析ライブラリを使用しますが、本番環境で何ヶ月も実行されてから中断するまで正規表現を使用しない多くのコーナー ケースが存在する可能性があるためです。
require 'nokogiri'
html = '<a href="https://mobile.twitter.com" rel="nofollow">Mobile Web</a>'
elem = Nokogiri::HTML::DocumentFragment.parse(html).child
p elem.text #=> Mobile Web