@Arran が解決しました。セレンは text() 関数でうまく機能しません。xpath
を ://table[@width=200]/tbody/tr[1]/td/a に更新しました。
内部システムを操作する必要がありますが、間に合いません。
実際に時間の問題があることを確認するために、ロードとスクリプトのタイムアウトを 30 時間に変更しました。
JavaScriptを無効にしました。
何も機能しませんでした。
Seleniumコードの非常に最小限のバージョンと、Webサーバーに配置する最小限のプレーンhtmlファイルバージョンを作成しました。
Chrome で開き、コンソールで $x('//table[@width=200]/tbody/tr[1]/td/a/text()') と入力すると、xpath が必要なものを取得します。
しかし、PhantomJSDriver で同じことを行うと、終わりのないプロセスがあります (タイムアウトが 30 時間に設定されていることはわかっています)。Fiddler で
比較すると、内容は同じです。
ここでは GPU は必要ありませんが、ChromeDriver を試してみると、gpu に関連する例外がスローされます。
[4588:4592:0519/143844:ERROR:gpu_info_collector_win.cc(140)] 評価結果からゲーム スコアを読み取れませんでした。
最小限の html は次のとおりです。
<html>
<head>
<title>Its a test</title>
</head>
<body>
<table width=200>
<tbody>
<tr>
<td>
<a href='http://uej65ge.com/lnk001.html'>text01</a>
</td>
<td>
<a href='http://uej65ge.com/lnk002.html'>text02</a>
</td>
</tr>
<tr>
<td>
<a href='http://uej65ge.com/lnk003.html'>text03</a>
</td>
<td>
<a href='http://uej65ge.com/lnk004.html'>text04</a>
</td>
</tr>
</tbody>
</table>
</body>
</html>
WebDriver コードは次のとおりです。
//------------------------------------------- ------
public void start() throws FileNotFoundException {
WebDriver driver;
driver = getPhanthomDriver();
scrapTest(driver);
}
//------------------------------------------------ -
private WebDriver getPhanthomDriver() {
WebDriver driver = null;
try {
DesiredCapabilities caps = new DesiredCapabilities();
String pathToPhantom = ConfigProvider.getStringConfig("pathToPhantom");
caps.setCapability(PhantomJSDriverService.PHANTOMJS_EXECUTABLE_PATH_PROPERTY, pathToPhantom);
caps.setJavascriptEnabled(false);
driver = new PhantomJSDriver(caps);
} catch (IOException ex) {
ConsoleHelper.printMessage("ERRO_io:" + ex.getMessage(), new Date());
} catch (Exception ex) {
ConsoleHelper.printMessage("ERRO_ex:" + ex.getMessage(), new Date());
}
return driver;
}
//------------------------------------------------ -
private WebDriver getChromeDriver() {
// [4588:4592:0519/143844:ERROR:gpu_info_collector_win.cc(140)] Could not read gaming score from assessment results.
// I dont need GPU here !!!
WebDriver driver = null;
try {
String pathToChrome = ConfigProvider.getStringConfig("pathToChrome");
System.setProperty("webdriver.chrome.driver", pathToChrome);
driver = new ChromeDriver();
} catch (Exception ex) {
ConsoleHelper.printMessage("ERRO_ex:" + ex.getMessage(), new Date());
}
return driver;
}
//------------------------------------------------ -
public void scrapTest(WebDriver driver) throws FileNotFoundException {
// this its form more than 05 minutes without return
try {
long pollingForSecond = 1;
long timeOutInSeconds = 999999;
if(driver == null){ throw new Exception("Erro, driver informado era nulo");}
String initialUrl = "http://devw7lng:8080/CPS/xpts.html";
driver.manage().timeouts().pageLoadTimeout(30, TimeUnit.HOURS);
driver.manage().timeouts().setScriptTimeout(30, TimeUnit.HOURS);
driver.get(initialUrl);
final String xpath_categoriasTexto = "'//table[@width=200]/tbody/tr[1]/td/a/text()'";
List<WebElement> elements = null;
try {
Wait<WebDriver> wait = new FluentWait<WebDriver>(driver)
.withTimeout(timeOutInSeconds, TimeUnit.SECONDS)
.pollingEvery(pollingForSecond, TimeUnit.SECONDS)
.ignoring(NoSuchElementException.class)
.ignoring(org.apache.http.NoHttpResponseException.class);
elements = wait.until(new Function<WebDriver, List<WebElement>>() {
@Override
public List<WebElement> apply(WebDriver driver) {
System.out.print(".");
return driver.findElements(By.xpath(xpath_categoriasTexto));
}
});
} catch (Exception err) {
}
boolean ok = false;
ok = ((elements != null) && (elements.size() > 0));
int x = 0;
} catch (Exception ex) {
ConsoleHelper.printMessage("ERRO_ex:" + ex.getMessage(), new Date());
}
}
//------------------------------------------------ -