0

特定の Web ページにアクセスして解析するために HTTParty を使用しています。

私の通常のアプローチを使用して:

response = HTTParty.get(url)
doc = Nokogiri::HTML(response)
doc.css('ul').each do |link|
  p link
end

クラス「ブロック」を持つページに到達するまで、すべてがうまくいっています。以下の html ツリーを参照してください。

<li class="river-block">        
 <div class="block block-thumb"> 

  <div class="block-content"> 
    Some content that I want                            
  </div>            

 </div>         
</li>

たとえば、次のようになります。

 doc.css('ul li').each do |link|
  p link
end

また

doc.css('ul li.river-block').each do |link|
  p link
end

何も返しません。

このクラス「ブロック」または「ブロックコンテンツ」とは何ですか? このタイプのアクセスをブロックするために使用されているのでしょうか、それとも間違った方法で行っているのでしょうか? もしそうなら、コンテンツを読むための他の方法はありますか?

4

1 に答える 1