java - JavaJerichoハイパーリンク解析

Question

アンカーtag（）にある場合を除いて、Webページ内のすべてのハイパーリンクを取得する方法を見つけようとしています。

このために、私はJerichoパーサーを使用しています。

私の最初のアプローチはとの違いを理解することでしたが List<Element> elementList = source.getAllElements();、 getAllElements(HTMLElementName.A)他の要素にもアンカーリンクが含まれている可能性があるため、それが正しいアプローチではないと思います。

score 0 · Accepted Answer

HTML処理にはJsoupをお勧めします。

aすべてのリンク（= -tag with href-attribute）を取得する方法の例を次に示します。

Document doc = Jsoup.connect("http:// - link here -").get(); // Connect to website and parse its html
Elements links = doc.select("a[href]"); // Select all 'a'-tags' with 'href'-attribute

for( Element element : links ) // iterate over all links (example)
{
    // process element
}

ドキュメンテーション：

ところで。これについてもう少し説明してもらえますか？

アンカータグ内にある場合を除く

java - JavaJerichoハイパーリンク解析

1 に答える 1

Related

Reference