内部属性データベースに対して監査できるサプライヤ Web サイトからいくつかの属性データを抽出するクローラーを作成しようとしていますが、import.io は初めてです。たくさんのビデオを見ましたが、私の構文は正しいようですが、手動の xpath オーバーライドは属性値を返しません。次のサンプルhtmlコードがあります。
<table>
<tbody><tr class="oddRow">
<td class="label"> Adhesive Type‎</td><td> Epoxy‎
</td>
</tr>
<tr>
<td class="label"> Applications‎</td><td> Hard Disk Drive Component Assembly‎
</td>
</tr>
<tr class="oddRow">
<td class="label"> Brand‎</td><td> Scotch-Weld‎
</td>
</tr>
<tr>
<td class="label"> Capabilities‎</td><td> Sustainability‎
</td>
</tr>
<tr class="oddRow">
<td class="label"> Color‎</td><td> Clear Amber‎
</td>
import.ioクローラーを介して「色」を取得するために、兄弟ステートメントに続くxpathを記述しようとしています。「色」を選択したときのxpathコードは次のとおりです。
//*[@id="attributeList"]/table/tbody/tr[5]/td[1]
私は使用しようとしました:
//*[@id="attributeList"]/table/tbody/tr/td[.="Color"]/following-sibling::td
ただし、テーブルから color 属性値を取得していません。奇数および偶数行クラスと関係があるかどうかはわかりませんか? HTML を見ると、論理的に理にかなっているように見えます。color は「Color」で、属性値は次の td ブラケットにあります。