css ファイルからすべての画像 (.jpg、.png、.gif) uri を抽出しようとしています。
サンプルCSS
.blockpricecont{width:660px;height:75px;background:url('../images/postBack.jpg')
repeat-x;/*background:url('../images/tabdata.jpg') repeat-x;*/border: 1px solid #B7B7B7;
使用される正規表現 -
images = re.compile("(?:\()(?:'|\")?(.*\.jpg('?))", flags=re.IGNORECASE)
問題は、コメント付きのコード (/* ---- */) を含む css クラスがほとんどなく、これらのコメントに .jpg 参照が含まれていることです。上記の正規表現で得られる出力は
output
["../images/postBack.jpg') repeat-x;/*background:url('../images/tabdata.jpg'"]
expected output:
["../images/postBack.jpg"]
.jpg の最初の一致で正規表現を停止したいのですが、行末まで継続します。
前もって感謝します。