HTML 全体を Selenium で取得する代わりに (そのためのより軽量なツールがあります。Get html file Javaを参照してください)、Selenium で適切な要素を選択できます。
Selenium RC を使用している場合:
// assuming 'selenium' is a healthy Selenium instance
String divText = selenium.getText("css=div[align='center']");
または、Selenium 2 (WebDriver) を使用している場合:
// assuming 'driver' is a healthy WebDriver instance
String divText = driver.findElement(By.cssSelector("div[align='center']")).getText();
実際にはさらに多くの<div align="center">
要素がある場合は、それらすべてを取得できます。
List<WebElement> divList = driver.findElements(By.cssSelector("div[align='center']"));
// and use every single one
for (WebElement elem : divList) {
System.out.print(elem.getText());
}
Selenium JavaDocs。特に、 WebDriver、WebElementを見たいと思っています。
そして、例の Selenium ドキュメント。それを読んで。