7

私は、別の Web サイトからいくつかの情報をスクラップする必要があるプロジェクトに取り組んでいます。HtmlUnitこの目的のために使用していますが、問題は、1 つのページの要素をトラバースできないことです。

例:

  <div id="some_id">

      <div>

        <div>

           <div>

              ......
                       many divs in between
              ......

               <div id="my_target_div"> some information </div>

                ........

                ........

                 </div>

divその中のIDmy_target_div と情報を取得する方法div

4

2 に答える 2

5

getHtmlElementByIdを使用します。

ドキュメントを確認してください。

例:

@Test
public void getElements() throws Exception {
    final WebClient webClient = new WebClient();

    final HtmlPage page = webClient.getPage("http://some_url");
    final HtmlDivision div = page.getHtmlElementById("my_target_div");

    webClient.closeAllWindows();
}

ソース。

于 2013-08-07T12:18:31.090 に答える
2
WebClient webClient = new WebClient();
        HtmlPage page;
  HtmlElement div= (HtmlElement) page2.getFirstByXPath("//div[@id='my_target_div']");

これで問題は解決します。

于 2016-11-16T06:46:40.397 に答える