0

このアプリは Web ページをダウンロードし、ページのテキスト内のすべてのメール アドレスを検索して、それらのリストを返します。

これは私の現在のコードです:

def emails(content):
'return list of email addresses contained in string content'
    email = []
    content = urlopen(url).read().decode()
    pattern='[A-Za-z0-9_.]+\@[A-Za-z0-9_.]+\....'
    email.append(re.findall(pattern,content))
    print(email)

しかし、何らかの理由で私は得る:

[['somePERSON@university.ca"']]

それ以外の :

['somePERSON@university.ca']
4

1 に答える 1

5

re.findall実際にはリストを返すので、リストにリストを追加しています。その動作が望ましくない場合は、次のようなことを行うことができますemail.extend(re.findall(pattern,content))(通常、一致が見つかり、一致しないものが適切に処理されるように、独自の行で一致をチェックします)。

于 2012-11-12T03:43:00.537 に答える