0

HTML のチャンクを Hpricot::Doc オブジェクトにロードする方法はありますか?

ページのカスタム タグ内の html のさまざまなチャンクを解析しようとしています。

私が持っている場合:

<foo>
  <b>here is some stuff</b>
  <table>
    <tr>
      <td>one</td>
      <td>two</td>
    </tr>
    <tr>
      <td>three</td>
      <td><four</td>
    </tr>
  </table>
</foo>

foo とそのコンテンツを Hpricot::Doc オブジェクト内で取得できるようにしたいと考えています。追加の処理を行い、最終的には swap() して、foo とそのすべての子がドキュメント内で置き換えられるようにする必要があるからです。

私は foo の子によって反復できることを知っていますが、すべてを 1 つのチャンクで取得して、物事をきれいに保つ方法があることを望んでいました。また、属性がある場合とない場合があります。それぞれが HTML のチャンクを持つ多くのアイテムがありますが、別の foo アイテムを含む foo アイテムはありません。

これはまったく可能ですか?最後に、Hpricot から始めましたが、違いがあれば Nokogiri にもオープンです。

4

1 に答える 1

1

何に問題があるのか​​わかりません。

あなたは好きなようにあなたのhtmlをhpricotに渡すことができます。

Readmeから

doc = Hpricot("<p>A simple <b>test</b> string.</p><foo>foo content</foo>")

fooを検索して交換できます

doc.search("//foo").first.swap "<blink>not foo</blink>"
于 2009-12-15T17:50:26.293 に答える