0

インターネットでこのトピックを検索しようとしましたが、適切な解決策が得られませんでした。サーブレットを介してページを開き、サーバーから受信した応答を取得して、応答から取得したデータを変更/取得できるようにしたいと考えています。自分のサーブレットから送信されたデータをフィルタリングすることについて話しているのではなく、他の Web サイトから応答を取得することについて話しているのです。

提案された読書は大歓迎です。

基本的に、FileIO を使用して、ページに存在するすべての href を抽出しようとしていました。しかし、事前にページをダウンロードする必要があったため、面倒なプロセスになる可能性があります。また、これを行う他の方法はありますか?ご意見をお聞かせください。

4

2 に答える 2

0

httpclientまたは他のhttpクライアントモジュールを使用できます

于 2012-05-17T11:47:35.630 に答える
0

Seleniumを試して、その webdriver API を利用することもできます。

List allLinks = driver.findElements(By.tagName("a"));

あるいは単に

Pattern linkElementPattern = Pattern.compile(“]*href=\”[^>]*>(.*?)“);
List<String> links = new ArrayList<String>();
// html is your HTML source String.. 
while (linkElementPattern.matcher(html)) {
       links.add(linkElementMatcher.group());
}
于 2012-05-17T12:11:32.243 に答える