そのため、ページに「Recipes adapted from」または「Recipe from」という用語が含まれている範囲内のすべての URL を取得しようとしています。これにより、約 7496 までのファイルへのすべてのリンクがコピーされ、HTTPError 404 が出力されます。何が間違っていますか? BeautifulSoup と requests を実装しようとしましたが、まだ機能しません。
import urllib2
with open('recipes.txt', 'w+') as f:
for i in range(14477):
url = "http://www.tastingtable.com/entry_detail/{}".format(i)
page_content = urllib2.urlopen(url).read()
if "Recipe adapted from" in page_content:
print url
f.write(url + '\n')
elif "Recipe from" in page_content:
print url
f.write(url + '\n')
else:
pass