のこぎりを使って、
doc = Nokogiri::HTML(your_html)
doc.xpath("//text()").to_s
これでうまくいきますが、すべてを 1 つのフラットなテキストにまとめます。
HTMLタグで囲まれた各テキストを取得する必要があります
<b> text</b>
<h1>text3</b>
それらを配列に入れます。[「テキスト」、「テキスト3」]
推奨されるアクションは何ですか?
やろうと思った
doc.xpath("*").テキスト
しかし、それをすべて反復する方法がわかりません。