2

Scrapy を使用して Web ページをクロールしています。

これで、スクリプト タグにいくつかのデータが含まれるようになりました。xpathを使用してスクリプトタグですべてのデータを取得すると、次のようになります。

 <script>
 some data

 abc.xyz=[["mohit","gupta","456123"]];

 some data
 </script>

データを入れたいのabc.xyzですが、入れられません。

4

1 に答える 1

1

abc.xyz=(.*?);変数値の抽出には正規表現を使用できます。また、そこから python リストを作成したい場合は、literal_eval()を使用できます。

from ast import literal_eval
import re

text = """<script>
 some data

 abc.xyz=[["mohit","gupta","456123"]];

 some data
 </script>"""

value = re.search('abc.xyz=(.*?);', text).group(1)
print value, type(value)

value = literal_eval(value)
print value, type(value)

プリント:

[["mohit","gupta","456123"]] <type 'str'>
[['mohit', 'gupta', '456123']] <type 'list'>
于 2013-09-19T07:26:00.350 に答える