誰かが文字列を抽出するのを手伝ってくれますか:
Advice about something
下から:
<TITLE>Advice about something</TITLE>
式は、 と の間の文字列をキャプチャできる必要が<TITLE>あり</TITLE>ます。などの表現を試みまし[^TITLE<g\/]たが、正しい出力が得られませんでした。
一時的なハックではなく堅牢なソリューションが必要な場合は、特定のパーサーを使用してください。
require "cgi"
require "nokogiri"
Nokogiri.parse(CGI.unescapeHTML(
"<TITLE>Advice about something</TITLE>"
))
.xpath("TITLE").text
# => "Advice about something"
左の部分<TITLE>と右の部分を取り、間</TITLE>に入れます。(.*?)<TITLE>(.*?)<\/TITLE>
依存します。文字列は常にセミカラムで区切られていますか?
tmp = "<TITLE>Advice about something</TITLE>"
=> "<TITLE>Advice about something</TITLE>"
tmp.split(';')[2].gsub(/\</, "")
=> "Advice about something"