私の仕事は、与えられたリンクの実際のプレスリリースリンクを見つけることです。たとえば、http://www.apple.com/pr/と言います。
私のツールは、そのサイトで見つかった他の広告リンク、タブリンク(またはその他)を除いて、上記のURLからプレスリリースリンクだけを見つける必要があります。
以下のプログラムが開発され、これがもたらす結果は、特定のWebページに存在するすべてのリンクです。
以下のプログラムを変更して、特定のURLからプレスリリースリンクのみを検索するにはどうすればよいですか?また、与えられた場合、任意のプレスリリースURLからプレスリリースリンクを識別するように、プログラムを汎用的にしたいと思います。
import java.io.*;
import java.net.URL;
import java.net.URLConnection;
import java.sql.*;
import org.jsoup.nodes.Document;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Element;
public class linksfind{
public static void main(String[] args) {
try{
URL url = new URL("http://www.apple.com/pr/");
Document document = Jsoup.parse(url, 1000); // Can also take an URL.
for (Element element : document.getElementsByTag("a")) {
System.out.println(element.attr("href"));}
}catch (Exception ex){ex.printStackTrace();}
}
}