0

htmlparser.Parser、私は html のスニペット (以下を参照) を持っており、ファイル内に一意の ID を持つこれらのコンテナー div の束のコンテンツを取得する必要があります。div とその内部の html を問題なく取得できます。H3タグ間のwhatsを取得する方法がわかりません

このコード スニペットは div では機能しますが、h3 では機能しません。正しい ID を持つ h3 が見つかった場合、innerHTML またはタグ間の内容を取得する方法がわかりません。

助けてくれてありがとう

    parser = new Parser();
    parser.setInputHTML(inHTML);
    parser.setEncoding("UTF-8");
    lstNodes = parser.extractAllNodesThatMatch(  new AndFilter(new TagNameFilter("h3"),
                                                  new HasAttributeFilter("id", "h3_"+num)));

これはそれを見つけますが、h3の間のデータを返しません

 <div class="container" id="container_2">
      <h3 id="h3_2">Adding a few</h3>       
      <div class="maindiv" id="div_2">
          ...new articles in here jus tto flesh it out.
      </div><!--end of div_2-->
  </div>
4

2 に答える 2

1

私は自分のタグを作成することになった

class H3Tag extends CompositeTag
于 2012-03-29T01:34:01.577 に答える
1

あなたはほとんどそこにいます。HeadingTag手動でキャストしgetStringText()、タグ間のテキストを取得するために使用できます。

NodeList nodes = parser.extractAllNodesThatMatch(new AndFilter(new TagNameFilter("h3"),
    new HasAttributeFilter("id", "h3_"+num)));
SimpleNodeIterator nodeIterator = nodes.elements();
while (nodeIterator.hasMoreNodes()) {
    Node node = nodeIterator.nextNode();
    HeadingTag tag = (HeadingTag)node;
    System.out.println(tag.getStringText());
}
于 2012-03-29T02:36:52.253 に答える