次のコードを使用して、Web ページ内のすべてのリンクを取得し、 を使用して各リンクをHttpURLConnection
チェックして、リンクのステータスを確認できます。
WebDriver driver = new FirefoxDriver();
driver.get("urlOfWebsite");
List<WebElement> links = driver.findElements(By.tagName("a"));
ArrayList<String> linksInvalid = new ArrayList<>();
ArrayList<String> linksResulting404 = new ArrayList<>();
for (WebElement link : links) {
URL u;
try {
u = new URL(link.getAttribute("href"));
HttpURLConnection huc = (HttpURLConnection) u.openConnection();
huc.setRequestMethod("GET");
huc.connect();
int code = huc.getResponseCode();
if (code == 404 || code == 400) {
//Add link text and href to linksResulting404 list
linksResulting404.add(link.getText() + " - "
+ link.getAttribute("href"));
}
} catch (MalformedURLException e) {
//Add link text and href to linksResulting404 list
linksInvalid.add(link.getText() + " - "
+ link.getAttribute("href"));
} catch (IOException e) {
e.printStackTrace();
}
}
System.out.println("Invalid links : ");
for (String linkInvalid : linksInvalid) {
System.out.println(linkInvalid);
}
System.out.println("\nLinks resulting in 404/400");
for (String linkResulting404 : linksResulting404) {
System.out.println(linkResulting404);
}
これが役立つかどうか教えてください。