0

Google スプレッドシート (importXML 関数) で使用する xpath クエリを見つけて、以下の HTML コードに含まれる次の情報を取得しようとしています: "ThisIsCompanyName" & "123456".

<tr valign="top" class="small"> 
                                <th width="18%" bgcolor="#EFEFEF" id="name" class="commonFontSize"> 
                                  <div align="right">Company Name</div></th>
                                <td width="33%" bgcolor="#FFFFFF" headers="name" align="left" style="padding-left:3px;"> 
                                    <span id="ctl00_ContentPlaceHolder1_lblTblCarrierName" class="oneSmallFontSize">ThisIsCompanyName</span>    
                                </td>
                                <th width="20%" bgcolor="#EFEFEF" id="dot" class="commonFontSize"> 
                                  <div align="right">U.S. DOT Number</div></th>
                                <td width="29%" bgcolor="#FFFFFF" headers="dot" align="left" style="padding-left:3px;"> 
                                    <span id="ctl00_ContentPlaceHolder1_lblTblDOTNumber" class="oneSmallFontSize">123456</span>  
                                </td>
                              </tr>

Chromeを使用して、「要素の検査」機能を使用してから「xpathをコピー」すると、次のようになります....

    //*[@id="ctl00_ContentPlaceHolder1_lblTblCarrierName"]
    //*[@id="ctl00_ContentPlaceHolder1_lblTblDOTNumber"]

しかし、これらは私が必要とする結果をもたらしていません。私はプログラミングの知識がなく、初歩的な Web スクレイピング技術を学ぼうとしています。

4

1 に答える 1

1

これを試して

//span[@id='ctl00_ContentPlaceHolder1_lblTblCarrierName']/text()
//span[@id='ctl00_ContentPlaceHolder1_lblTblDOTNumber']/text()

この xpath を使用すると、「ThisIsCompanyName123456」が返されます。

//span[@class='oneSmallFontSize']/text()
于 2013-04-16T15:51:44.020 に答える