Webページから解析した後にスクリプトの場所を抽出するpythonスクリプトを書いています。2 つのシナリオがあるとします。
<script type="text/javascript" src="http://example.com/something.js"></script>
と
<script>some JS</script>
2 番目のシナリオ、つまり JS がタグ内に記述されている場合から JS を取得できます。
しかし、最初のシナリオから src の値を取得する方法はありますか (つまり、http://example.com/something.jsなどのスクリプト内の src タグのすべての値を抽出します) 。
これが私のコードです
#!/usr/bin/python
import requests
from bs4 import BeautifulSoup
r = requests.get("http://rediff.com/")
data = r.text
soup = BeautifulSoup(data)
for n in soup.find_all('script'):
print n
出力: 一部の JS