python - mechanize で 404 を回避する

Question

URL のファイルを読み取る Python スクリプトを作成していますが、すべてが機能するとは限りません。以下に投稿したエラーを発生させるのではなく、これを回避してファイルの次の行を読み取る方法を見つけようとしています。ある種の if ステートメントが必要なのはわかっていますが、よくわかりません。

from mechanize import Browser
from BeautifulSoup import BeautifulSoup
import csv

me = open('C:\Python27\myfile.csv')
reader = csv.reader(me)
mech = Browser()

for url in me:
    response =  mech.open(url)
    html = page.read()
    soup = BeautifulSoup(html)
    table = soup.find("table", border=3)

for row in table.findAll('tr')[2:]:
    col = row.findAll('td')
    BusinessName = col[0].string
    Phone = col[1].string
    Address = col[2].string
    City = col[3].string
    State = col[4].string
    Zip = col[5].string
    Restaurantinfo = (BusinessName, Phone, Address, City, State)
    print "|".join(Restaurantinfo)

そのコードブロックを実行すると、次のエラーが発生します。

httperror_seek_wrapper: HTTP エラー 404: 見つかりません

基本的に私が求めているのは、Python がそれを無視して次の URL を試す方法です。

score 1 · Accepted Answer

ファイルに URL しかない場合は、1 行に 1 つの URL を記述して、次のようなコードを使用する方が簡単かもしれません。

from mechanize import Browser
from BeautifulSoup import BeautifulSoup


me = open('C:\Python27\myfile.csv')
mech = Browser()

for url in me.readlines():
    ...

コードを保持したい場合は、次を使用する必要があります。

for url in reader:
    ...

python - mechanize で 404 を回避する

1 に答える 1

Related

Reference