1

フィールドの先頭から特定の単語まですべてを削除するために、yahooパイプで正規表現を作成するにはどうすればよいですか?

私はYouTubeからRSSを取っています、

http://www.youtube.com/rss/search/%s.rss

ビュー数を抽出して別のフィールドとして追加したいと考えています。ビュー カウントは説明フィールドにあり、次のように表示されます。

<div><span style="color:#666666;font-size:11px;">Views:</span>
431</div>

この場合、抽出する必要がある数は 431 です。

ありがとう、
ピエトロ

PS: 以下は、最近の検索の説明の一部です。コードが長すぎるため、コード全体を入れませんでした。

<div style="font-size:12px;margin:3px 0px;"><span>a frankly shoddy cover of Susan Cadogan&#39;s big hit! Reminds me of my first &#39;squeeze&#39; at The Hummingbird under 18&#39;s sesh, monkey boots, (couldn&#39;t afford Docs),fred perry t shirt and stapress &#39;champagne&#39; 2 tone trousers robbed from Nelson House....................</span></div></td>
<td style="font-size:11px;line-height:1.4em;padding-left:20px;padding-top:1px;" width="146" valign="top"><div><span style="color:#666666;font-size:11px;">From:</span>
<a rel="nofollow" target="_blank" href="http://www.youtube.com/channel/UCZ0m4ZjZMNdOl4uyvrQm-yw">TheLastMehari</a></div>
<div><span style="color:#666666;font-size:11px;">Views:</span>
431</div>
<div style="white-space:nowrap;text-align:left;"><img style="border:0px none;margin:0px;padding:0px;vertical-align:middle;font-size:11px;" align="top" alt="" src="http://gdata.youtube.com/static/images/icn_star_empty_11x11.gif"> <img style="border:0px none;margin:0px;padding:0px;vertical-align:middle;font-size:11px;" align="top" alt="" src="http://gdata.youtube.com/static/images/icn_star_empty_11x11.gif"> <img style="border:0px none;margin:0px;padding:0px;vertical-align:middle;font-size:11px;" align="top" alt="" src="http://gdata.youtube.com/static/images/icn_star_empty_11x11.gif"> <img style="border:0px none;margin:0px;padding:0px;vertical-align:middle;font-size:11px;" align="top" alt="" src="http://gdata.youtube.com/static/images/icn_star_empty_11x11.gif"> <img style="border:0px none;margin:0px;padding:0px;vertical-align:middle;font-size:11px;" align="top" alt="" src="http://gdata.youtube.com/static/images/icn_star_empty_11x11.gif"></div>
4

3 に答える 3

1

交換部品は次のようになります。

^.*Views:\D*(\d+).*$

...そして交換部品は

$1

Views:つまり、文字列から数字以外の記号だけで区切られているすべての数字をキャッチし、残りはすべて破棄します。

更新:/sこれを機能させるには、修飾子を有効にする必要があります。別の方法は、次の代わりに「ユニバーサル」文字クラスを使用することです.

^[\s\S]*Views:\D*(\d+)[\s\S]*$

交換部品は同じままである必要があります。

于 2012-10-01T16:48:15.653 に答える
1

おそらくこのようなものですか?http://rubular.com/r/boubtEmP4s

于 2012-10-01T16:45:20.563 に答える
0

最後に、2つの提案をマージし、次を使用することになりました。

^[\s\S]*Views:\<\/span\>\s*(\d+)[\s\S]*$
于 2012-10-01T18:09:37.450 に答える