サイトをクロールしようとしていますが、禁止されないようにプロキシを使用する必要があります。
proxies.each do |proxy|
proxy.delete '""'
break if @doc = Nokogiri::HTML(open(pre, :proxy => proxy )) rescue nil
end
proxies
配列内に動作中のプロキシのリストがあります。pre
はURLです。このコードからの応答はありません。ゼロです。これを以下のコードに置き換えると動作しますが、IP 禁止のリスクがあります。
doc = Nokogiri::HTML(open(pre))
何かご意見は?