5

ウィキペディアからコンテンツのページを取得するために wikipedia-api プラグインを使用しています。コンテンツを取得しようとすると、次のエラーが表示される日があります。

  page = Wikipedia.find_by_titles('Foo')
OpenURI::HTTPError: 403 Forbidden
    from /usr/lib/ruby/1.8/open-uri.rb:277:in `open_http'
    from /usr/lib/ruby/1.8/open-uri.rb:616:in `buffer_open'
    from /usr/lib/ruby/1.8/open-uri.rb:164:in `open_loop'
    from /usr/lib/ruby/1.8/open-uri.rb:162:in `catch'
    from /usr/lib/ruby/1.8/open-uri.rb:162:in `open_loop'
    from /usr/lib/ruby/1.8/open-uri.rb:132:in `open_uri'
    from /usr/lib/ruby/1.8/open-uri.rb:518:in `open'
    from /usr/lib/ruby/1.8/open-uri.rb:30:in `open'
    from /home/luca/Programming/nerto_5/vendor/plugins/wikipedia-api/lib/mediawiki.rb:139:in `get_xml'

それは何ですか?

どのようにできるのか?

ありがとう

4

2 に答える 2

6

私は変更を解決しました

Hpricot.XML(open(url))

  Hpricot.XML(open(url, 'User-Agent' => 'ruby'))

mediawiki.rb ファイル内

于 2010-02-22T13:39:49.400 に答える
3

はい、動作します。

Nokogiri403Forbiddenの問題についても同じです

doc = Nokogiri :: HTML(open(site、'User-Agent' =>'ruby'))

于 2010-09-04T21:00:08.420 に答える