タグを抽出しようとしているドキュメントがあります。それらのいくつかは、class 属性を持つ div タグ内にあり、クラスには display:none プロパティが設定されています。div タグの style 属性を直接使用して非表示にすることはできません。それらをなくしたい。リンクタグを使用してCSSをページに組み込みます。
1056 次
1 に答える
0
すべてのタグを選択し<a>
、親の 1 つが<div>
非表示クラスを持つかどうかを検索します。
for (Element a : doc.getElementsByTag("a")) {
for (Element parent : a.parents()) {
if (parent.tagName().equals("div") && parent.hasClass("hidden")) {
a.remove();
}
}
}
または簡単に-<div>
隠蔽クラスですべてのアンカーを削除するだけです:
doc.select("div.hidden a").remove();
于 2013-09-08T08:01:16.037 に答える