13

URLのフェッチを処理する簡単な関数を書きました:

def tender_page_get url, agent
  sleep(rand(6)+2)
  begin
    return agent.get(url).parser
  rescue Errno::ETIMEDOUT, Timeout::Error, Net::HTTPNotFound
    EYE.debug "--winter sleep #{url}"
    puts "-x-#{url}"
    sleep(300)
    tender_page_get url, agent
  rescue => e
    puts "-x-#{url}"
    EYE.debug "--unknown exception"
    EYE.debug "#{url} #{e.inspect}"
  end
end

問題は、最初のレスキュー ブロックをキャッチNet::HTTPNotFoundしているにもかかわらず、ログ レコードに次のように表示されることです。

--unknown exception
{url} 404 => Net::HTTPNotFound

これは、この例外が 2 番目のレスキュー ブロックによってキャッチされたことを意味します。その理由は何でしょうか?

4

1 に答える 1

19

Mechanize は、Net::HTTPNotFound ではなく 404 に対して Mechanize::ResponseCodeError を発生させます。Mechanize::ResponseCodeError の to_s は次のようになります。

def to_s
  "#{response_code} => #{Net::HTTPResponse::CODE_TO_OBJ[response_code]}"
end

これは '404 => Net::HTTPNotFound' を返し、これが発生した例外であるように見えます。

于 2011-05-22T09:50:48.317 に答える