すべての href リンクを解析するために Jericho Java クライアント ライブラリを使用しています。私がやりたいことは、特定の ID を含むソースからのすべてのリンクを除外またはスキップすることです。私はいくつかのことを試しましたが、私の解決策はきれいではありませんが、基本的には次のようなものをチェックすることでこれを達成できます:
for(Element element : elements) {
if (element.getAllStartTags().toString().contains("skip_me")) {
// do something
}
}
しかし、私はよりクリーンなソリューションを好みます。これがソースであると仮定しましょう:
<td>
<a href="http://www.yahoo.com" id="skip_me" />
</td>
<td>
<a href="http://www.google.com" />
</td>
ちょっとしたスニペットですが、最終的に返してほしいのは「www.google.com」だけです。これについて何か助けていただければ幸いです。ありがとう。