私はノコギリを使ってさまざまな国に関するウィキペディアのページを開き、インターウィキリンク(外国語のウィキペディアへのリンク)から他の言語でこれらの国の名前を抽出しています。しかし、フランスのページを開こうとすると、のこぎりは全ページをダウンロードしません。多分それは大きすぎます、とにかくそれは私が必要とするインターウィキリンクを含んでいません。どうすればすべてを強制的にダウンロードできますか?
これが私のコードです:
url = "http://en.wikipedia.org/wiki/" + country_name
page = nil
begin
page = Nokogiri::HTML(open(url))
rescue OpenURI::HTTPError=>e
puts "No article found for " + country_name
end
language_part = page.css('div#p-lang')
テスト:
with country_name = "France"
=> []
with country_name = "Thailand"
=> really long array that I don't want to quote here,
but containing all the right data
たぶん、この問題はNokogiriを超えてOpenURIにまで及ぶでしょう-とにかく私は解決策を見つける必要があります。