0

django-dynamic-scraper aka DSS (django+scrapy) を使用して xpath と Web スクレイピングを学習しており、次のコードを使用して Web サイトからデータを取得しようとしています。

<tr valign="top">
    <td align="center" valign="top">
        <p><img src="someimage.jpg"></p>
    </td>
    <td>
    &nbsp;
    </td>
    <td>
        <div align="left">
            <span class="style1">
                <strong>Title1</strong>
            </span>
            <span class="style2">Title2:</span>ContentA<br />
            <span class="style2">Title3:</span>ContentB<br />
            <span class="style2">Title4:</span>ContentC<br />
        </div>
    </td>
</tr>

私の質問:

  • an URL object of DSSそのコードにリンクがない場合、xpath は何ですか?
  • 最初のクラスがない場合、画像ファイルを取得するための xpath は何<td>ですか?
  • スパンのクラスが の場合、ContentA、ContentB、および ContentC からデータのデータを取得する方法はsame?
4

1 に答える 1

1

そのコードにリンクがない場合、DSSのURLオブジェクトのxpathは何ですか?

質問が聞き取れませんでしたが、説明していただけますか?

最初のクラスがない場合に画像ファイルを取得するためのxpathは何ですか?

//tr[1]/td[1]//img/@src

スパンのクラスが同じである場合、ContentA、ContentB、およびContentCから各データのデータを取得するにはどうすればよいですか?

//text()[preceding-sibling::span[@class="style2"]]

于 2013-02-22T12:30:33.733 に答える