私は最近、Python の BeautifulSoup Library を使用して大量のメタデータをスクレイピングしました。そのメタデータに含まれるすべての URL を .txt ファイルに保存しました。ただし、代わりにすべてのリダイレクト URL が必要です。私は一度に1つのURLを行うことができます:
def get_redirect_url(url):
opener = urllib2.build_opener(urllib2.HTTPRedirectHandler)
request = opener.open(url)
return request.url
print get_redirect_url("www.foo.com")
print ""
テキスト ファイルをリストに渡してから、そのリストを引数として渡そうとしましたが、次のエラーが発生しました。
def get_redirect_url(url):
opener = urllib2.build_opener(urllib2.HTTPRedirectHandler)
request = opener.open(url)
return request.url
with open ('openCRS_url.txt', 'r') as myFile:
data = [line.strip() for line in myFile]
print get_redirect_url(*data)
print ""
テキスト ファイルまたはそのテキスト ファイルからのデータのリスト表現を関数のパラメーターとして渡し、ファイルをループし、すべてのリダイレクト URL を抽出する方法はありますか? 皆さん、ありがとうございました。