-5

HTML 応答の本文/文字列があります。そのhtmlコンテンツの一部はこれらの文字列です-

<h2><a href="javascript:;" class="user-name-class">MY_USER_NAME<b></b></a></h2>

["media_detail","init",[false,"",null,true,1,4,"99999_XXXXX_99999",11836530,"00076f7474727febc37a8825d373a5be","\/p\/LdvJWSF-6b\/","\/accounts\/login\/"]],

これらから私は抽出する必要がMY_USER_NAMEあります99999_XXXXX_99999

正規表現のロックスターからの助けをいただければ幸いです。これは ruby​​ 1.9.3 にあります。ありがとう。

更新:これはリアルタイムで行われないため、正規表現を使用しているため、パフォーマンスは問題になりません。

4

3 に答える 3

3

最初のものは HTML であるため、HTML で解析する必要があり、もう 1 つは JSON であるため、JSON ライブラリを使用できます。正規表現を使用しないでください。だ。

于 2012-11-02T20:20:46.063 に答える
0

使用できます

s.split(/"user-name-class">/)[1].split(/</)[0]

(このデモを参照)

s.split(/\["media_detail"/)[1].split(/\[/)[1].split(/"?,"?/)[6]

(このデモを参照)

于 2012-11-02T20:42:39.713 に答える
0

HTML/JSON ライブラリを使用したくない場合は、次の方法で最初のものを取得できます。

str.gsub!(/<.*?>/, '')

2 番目のものを正規表現するには、文字列の形式について詳しく説明する必要があります...何が一貫しているか、何が一貫していないかなど.

于 2012-11-02T20:33:27.820 に答える