0

アンカーtag()にある場合を除いて、Webページ内のすべてのハイパーリンクを取得する方法を見つけようとしています。

このために、私はJerichoパーサーを使用しています。

私の最初のアプローチはとの違いを理解することでしたが List<Element> elementList = source.getAllElements();getAllElements(HTMLElementName.A)他の要素にもアンカーリンクが含まれている可能性があるため、それが正しいアプローチではないと思います。

4

1 に答える 1

0

HTML処理にはJsoupをお勧めします。

aすべてのリンク(= -tag with href-attribute)を取得する方法の例を次に示します。

Document doc = Jsoup.connect("http:// - link here -").get(); // Connect to website and parse its html
Elements links = doc.select("a[href]"); // Select all 'a'-tags' with 'href'-attribute

for( Element element : links ) // iterate over all links (example)
{
    // process element
}

ドキュメンテーション:

ところで。これについてもう少し説明してもらえますか?

アンカータグ内にある場合を除く

于 2013-02-04T17:08:05.440 に答える