次のことを行うアプリケーションを構築しています。
- .txt ファイルからホストを取得し、リストに配置します
- 各 Web サイトのヘッダーをダウンロードし、別のリストに追加します
- 特定の単語を含む行を、タイムスタンプ、特定の行、およびそれに属する URL を含むログファイルに出力します。
実際にはすべて正常に動作していますが、チェックされている URL を他の関数に渡して使用できるようにすることはできません。
このリンクのコード: http://pastebin.com/630FrspN
実際には、ログファイルの各エントリに同じ URL を出力します... ログファイル (websiteheaders,url) を for ループに入れると、機能しますが、ログファイルに URL がある回数だけエントリが出力されます。ホストファイル。
forループでチェックされている「url」をlogfile関数に渡す必要があります...
おそらく簡単な答えですが、見つけられないようです。前もって感謝します。
編集:以下のコードが最も関連性があると思います。
def headerophalen(websites):
for url in websites:
try:
response = urllib2.urlopen(url)
headers = str(response.info())
websiteheaders.extend(headers.splitlines())
except urllib2.HTTPError, error:
print "Error opening URL: ", url, "HTTP Errorcode: ", error.code
continue
logfile(websiteheaders, url)