Scrapy を使用して Web ページをクロールしています。
これで、スクリプト タグにいくつかのデータが含まれるようになりました。xpathを使用してスクリプトタグですべてのデータを取得すると、次のようになります。
<script>
some data
abc.xyz=[["mohit","gupta","456123"]];
some data
</script>
データを入れたいのabc.xyz
ですが、入れられません。
Scrapy を使用して Web ページをクロールしています。
これで、スクリプト タグにいくつかのデータが含まれるようになりました。xpathを使用してスクリプトタグですべてのデータを取得すると、次のようになります。
<script>
some data
abc.xyz=[["mohit","gupta","456123"]];
some data
</script>
データを入れたいのabc.xyz
ですが、入れられません。
abc.xyz=(.*?);
変数値の抽出には正規表現を使用できます。また、そこから python リストを作成したい場合は、literal_eval()を使用できます。
from ast import literal_eval
import re
text = """<script>
some data
abc.xyz=[["mohit","gupta","456123"]];
some data
</script>"""
value = re.search('abc.xyz=(.*?);', text).group(1)
print value, type(value)
value = literal_eval(value)
print value, type(value)
プリント:
[["mohit","gupta","456123"]] <type 'str'>
[['mohit', 'gupta', '456123']] <type 'list'>