Linked Data 用の Web クローラーを構築しています。次のコードによって、HTML ページと RDF/XML ページを区別しました。
public static int checktype(URL url) throws IOException
{
String contentType = ((HttpURLConnection) url.openConnection()).getContentType();
System.out.println("Website is read");
int t=0;
if("text/html".equals(contentType)) {t=0;}
else if("application/rdf+xml".equals(contentType)) {t=1;}
System.out.println(contentType);
return t;
}
ここで、RDF/XML データを含む Web ページを解析して、そのページからすべての URI を抽出したいと考えています。HTML パーサーは見つかりましたが、Linked Data は見つかりませんでした。さらに助けてください