1

タグを抽出しようとしているドキュメントがあります。それらのいくつかは、class 属性を持つ div タグ内にあり、クラスには display:none プロパティが設定されています。div タグの style 属性を直接使用して非表示にすることはできません。それらをなくしたい。リンクタグを使用してCSSをページに組み込みます。

4

1 に答える 1

0

すべてのタグを選択し<a>、親の 1 つが<div>非表示クラスを持つかどうかを検索します。

for (Element a : doc.getElementsByTag("a")) {
    for (Element parent : a.parents()) {
        if (parent.tagName().equals("div") && parent.hasClass("hidden")) {
            a.remove();
        }
    }
}

または簡単に-<div>隠蔽クラスですべてのアンカーを削除するだけです:

doc.select("div.hidden a").remove();
于 2013-09-08T08:01:16.037 に答える