特定の Web ページにアクセスして解析するために HTTParty を使用しています。
私の通常のアプローチを使用して:
response = HTTParty.get(url)
doc = Nokogiri::HTML(response)
doc.css('ul').each do |link|
p link
end
クラス「ブロック」を持つページに到達するまで、すべてがうまくいっています。以下の html ツリーを参照してください。
<li class="river-block">
<div class="block block-thumb">
<div class="block-content">
Some content that I want
</div>
</div>
</li>
たとえば、次のようになります。
doc.css('ul li').each do |link|
p link
end
また
doc.css('ul li.river-block').each do |link|
p link
end
何も返しません。
このクラス「ブロック」または「ブロックコンテンツ」とは何ですか? このタイプのアクセスをブロックするために使用されているのでしょうか、それとも間違った方法で行っているのでしょうか? もしそうなら、コンテンツを読むための他の方法はありますか?