0

サイト ID、HTML ヘッダー、HTML フッターの 3 つの列を持つ CSV ファイルがあります。

HTML のヘッダー列とフッター列を調べて、Google アナリティクス トラッキング コードの任意のバージョンを見つけて削除する必要がありますが、それらのセルの他の部分はそのまま残します。

私はこの正規表現を使用してみました:<script(?m:.*?)\'UA-.{8,12}\'(?m:.*?)</script>しかし、おそらく CSV のどこかで不正な形式のコードが原因で、破棄されて削除されすぎているようです。

これを行うためのより良い方法に関するアイデアはありますか?

4

1 に答える 1

1

迅速なハッキーな 1 回限りの置換の場合、貪欲でない繰り返しを避け、繰り返し内の許可されたシーケンスから<scriptorを除外することで、おそらく修正できます。</script両方.*?

(?:(?!</?script).)*
于 2013-08-27T21:13:50.137 に答える