0

文字列内のすべてのsrcとhrefを検索し、それらを完全にクイル化するURLに置き換える必要があります。

例:src = "/ test / style.css?somethinghere"はsrc ="http://www.mydomain.com/test/style.css?somethinghere"になります

同じことがhrefにも当てはまります。

Webリレーサーバーで使用します。

正規表現置換を使用しますが、正規表現はどのように見えますか?

4

1 に答える 1

0

興味のある正規表現の種類などの重要な情報が不足しています。perl互換の正規表現を参照していると想定しています。

いずれにせよ、これはガイダンスと理論と答えに役立ちます。使用されているエンジン/言語を教えていただければ、おそらくこれをニーズに合わせるのに役立ちます。

私は、さまざまな場所から関連するニュースフィードを収集、前処理、フィルタリング、転送するのに似たものを使用しています。MSDNには、相対URIのこの問題があります。これについては、次のように構成します。

'msdn' => {
             'action' => [
                         {
                           'tag' => 'get_url_as_content'
                         },
...
...
                         {
                           'regex' => 's/<img( [^\\/>]*)src="\\//<img$1src="http:\\/\\/blogs.msdn.com\\//gsi',
                           'tag' => 'mod_content'
                         },
                         {
                           'regex' => 's/<a( [^\\/>]*)href="\\//<a$1href="http:\\/\\/blogs.msdn.com\\//gsi',
                           'tag' => 'mod_content'
                         }
...
...
                       ]
           },

ここでは、私が使用している2つの正規表現を見ることができます。

これは、imgとsrcの単語の間のコンテンツを復元してから、URLを絶対にします。

s/<img( [^\/>]*)src="\//<img$1src="http:\/\/blogs.msdn.com\//gsi

同様にアンカータグの場合...

s/<a( [^\/>]*)href="\//<a$1href="http:\/\/blogs.msdn.com\//gsi

これらはかなり長い間、問題なく3年以上機能しています:-)

お役に立てれば。

于 2012-07-11T10:34:31.427 に答える