文字列内のすべてのsrcとhrefを検索し、それらを完全にクイル化するURLに置き換える必要があります。
例:src = "/ test / style.css?somethinghere"はsrc ="http://www.mydomain.com/test/style.css?somethinghere"になります
同じことがhrefにも当てはまります。
Webリレーサーバーで使用します。
正規表現置換を使用しますが、正規表現はどのように見えますか?
文字列内のすべてのsrcとhrefを検索し、それらを完全にクイル化するURLに置き換える必要があります。
例:src = "/ test / style.css?somethinghere"はsrc ="http://www.mydomain.com/test/style.css?somethinghere"になります
同じことがhrefにも当てはまります。
Webリレーサーバーで使用します。
正規表現置換を使用しますが、正規表現はどのように見えますか?
興味のある正規表現の種類などの重要な情報が不足しています。perl互換の正規表現を参照していると想定しています。
いずれにせよ、これはガイダンスと理論と答えに役立ちます。使用されているエンジン/言語を教えていただければ、おそらくこれをニーズに合わせるのに役立ちます。
私は、さまざまな場所から関連するニュースフィードを収集、前処理、フィルタリング、転送するのに似たものを使用しています。MSDNには、相対URIのこの問題があります。これについては、次のように構成します。
'msdn' => {
'action' => [
{
'tag' => 'get_url_as_content'
},
...
...
{
'regex' => 's/<img( [^\\/>]*)src="\\//<img$1src="http:\\/\\/blogs.msdn.com\\//gsi',
'tag' => 'mod_content'
},
{
'regex' => 's/<a( [^\\/>]*)href="\\//<a$1href="http:\\/\\/blogs.msdn.com\\//gsi',
'tag' => 'mod_content'
}
...
...
]
},
ここでは、私が使用している2つの正規表現を見ることができます。
これは、imgとsrcの単語の間のコンテンツを復元してから、URLを絶対にします。
s/<img( [^\/>]*)src="\//<img$1src="http:\/\/blogs.msdn.com\//gsi
同様にアンカータグの場合...
s/<a( [^\/>]*)href="\//<a$1href="http:\/\/blogs.msdn.com\//gsi
これらはかなり長い間、問題なく3年以上機能しています:-)
お役に立てれば。