ruby - 正規表現の HTML ヘルプが必要

Question

HTML 応答の本文/文字列があります。そのhtmlコンテンツの一部はこれらの文字列です-

<h2><a href="javascript:;" class="user-name-class">MY_USER_NAME<b></b></a></h2>

["media_detail","init",[false,"",null,true,1,4,"99999_XXXXX_99999",11836530,"00076f7474727febc37a8825d373a5be","\/p\/LdvJWSF-6b\/","\/accounts\/login\/"]],

これらから私は抽出する必要がMY_USER_NAMEあります99999_XXXXX_99999

正規表現のロックスターからの助けをいただければ幸いです。これは ruby 1.9.3 にあります。ありがとう。

更新:これはリアルタイムで行われないため、正規表現を使用しているため、パフォーマンスは問題になりません。

score 3 · Accepted Answer

最初のものは HTML であるため、HTML で解析する必要があり、もう 1 つは JSON であるため、JSON ライブラリを使用できます。正規表現を使用しないでください。悪だ。

score 0 · Accepted Answer

使用できます

s.split(/"user-name-class">/)[1].split(/</)[0]

(このデモを参照)

と

s.split(/\["media_detail"/)[1].split(/\[/)[1].split(/"?,"?/)[6]

(このデモを参照)

score 0 · Accepted Answer

HTML/JSON ライブラリを使用したくない場合は、次の方法で最初のものを取得できます。

str.gsub!(/<.*?>/, '')

2 番目のものを正規表現するには、文字列の形式について詳しく説明する必要があります...何が一貫しているか、何が一貫していないかなど.

ruby - 正規表現の HTML ヘルプが必要

3 に答える 3

Related

Reference