インラインスクリプトと「リンクされた」スクリプトを分離して、HTML文字列からすべてのスクリプトタグを取得する必要があります。src
インライン スクリプトとは、属性のないスクリプト タグを意味します。
「リンクされたスクリプト」を取得する方法は次のとおりです。
<script(.)+src=(.)+(/>|</script>)
そのため、<script
1 つ以上の任意の文字が続きsrc=
、その後に 、/>
またはが続き</script>
ます。
これは期待どおりに機能します。
今、私は src タグなしですべてのスクリプトタグを取得したいと思って<script .....>
い</script>
ます。私は正規表現を理解し始めたばかりなので、より経験豊富な正規表現の専門家の助けが必要です:)
更新 OK、親愛なる反対票を投じてください。変数にhtmlページ全体のhtmlコードがあります。そこからスクリプトタグを抽出したい。たとえばjqueryを使用して、それを行う方法は?
var dom = $(html);
console.log(html.find('script');
動作しないでしょう。それで、それを達成する方法は何ですか?
UPDATE 2 この問題を正規表現で解決する必要はありませんが、今はそれらについて学んでいるので、試してみようと思いました。私は他の解決策のために開かれています。