誰かが文字列を抽出するのを手伝ってくれますか:
Advice about something
下から:
<TITLE>Advice about something</TITLE>
式は、 と の間の文字列をキャプチャできる必要が<TITLE>
あり</TITLE>
ます。などの表現を試みまし[^TITLE<g\/]
たが、正しい出力が得られませんでした。
一時的なハックではなく堅牢なソリューションが必要な場合は、特定のパーサーを使用してください。
require "cgi"
require "nokogiri"
Nokogiri.parse(CGI.unescapeHTML(
"<TITLE>Advice about something</TITLE>"
))
.xpath("TITLE").text
# => "Advice about something"
左の部分<TITLE>
と右の部分を取り、間</TITLE>
に入れます。(.*?)
<TITLE>(.*?)<\/TITLE>
依存します。文字列は常にセミカラムで区切られていますか?
tmp = "<TITLE>Advice about something</TITLE>"
=> "<TITLE>Advice about something</TITLE>"
tmp.split(';')[2].gsub(/\</, "")
=> "Advice about something"