HTMLドキュメントからデータを抽出することになっている次のコードがあります。エクリプスを使用しました。2 つのエラーが表示されます (ただし、このコードは JSoup サイトからチュートリアルとしてコピーして貼り付けたものです)。1) ファイル、および 2) 要素のエラー。この 2 つのタイプに問題は見られません。
import java.io.IOException; java.net.MalformedURLException をインポートします。
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
public class TestClass
{
public static void main(String args[]) throws IOException
{
try{
File input = new File("/tmp/input.html");
Document doc = Jsoup.parse(input, "UTF-8", "http://example.com/");
Element content = doc.getElementById("content");
Elements links = content.getElementsByTag("a");
for (Element link : links) {
String linkHref = link.attr("href");
String linkText = link.text();
}
}//try
catch (Exception e){//Catch exception if any
System.err.println("Error: " + e.getMessage());
}//catch
}
}</i>