0

現在、次のような出力が得られます。

http://www.site.com/prof.php?pID=478http://www.site.com/prof.php?pID=693

以下のコメンターからの提案を使用した後、私は持っています:

urls = [el.url for el in domainLinkOutput]
return HttpResponse(urls)

この出力を次のような Python 辞書に変換するにはどうすればよいですか。

urls = { '0': 'http://www.site.com/prof.php?pID=478', '1': 'http://www.site.com/prof.php?pID=693' }
4

3 に答える 3

1

URL の照合には、次の正規表現を使用します。

url='([^']+)'

出力例:

    [0] => http://www.somesite.com/prof.php?pID=478
    [1] => http://www.somesite.com/prof.php?pID=527
    [2] => http://www.somesite.com/prof.php?pID=645

パラメータを除外したい場合は、

url='([^'?]+)

出力例:

    [0] => http://www.somesite.com/prof.php
    [1] => http://www.somesite.com/prof.php
    [2] => http://www.somesite.com/prof.php
于 2013-08-09T16:30:57.517 に答える
1

ここで正規表現が必要だとは思わない-Link持っているオブジェクトで属性アクセスを使用するだけです...

Linkオブジェクトのリストがある場合は、次のようなものを使用します。

urls = [el.url for el in list_of_objects]

URLを取得できるはずLink_object.urlです...

于 2013-08-09T16:26:41.853 に答える
0

試すことができre.finditerます。

r = re.compile("url='(.*?)'")
for match in r.finditer(input):
    print match.group[1]

ここで Python のドキュメントを読むことができます。

于 2013-08-09T16:40:13.750 に答える