django - リンクなしのスクレイピング

Question

django-dynamic-scraper aka DSS (django+scrapy) を使用して xpath と Web スクレイピングを学習しており、次のコードを使用して Web サイトからデータを取得しようとしています。

<tr valign="top">
    <td align="center" valign="top">
        <p><img src="someimage.jpg"></p>
    </td>
    <td>
    &nbsp;
    </td>
    <td>
        <div align="left">
            <span class="style1">
                <strong>Title1</strong>
            </span>
            <span class="style2">Title2:</span>ContentA<br />
            <span class="style2">Title3:</span>ContentB<br />
            <span class="style2">Title4:</span>ContentC<br />
        </div>
    </td>
</tr>

私の質問:

an URL object of DSSそのコードにリンクがない場合、xpath は何ですか?
最初のクラスがない場合、画像ファイルを取得するための xpath は何<td>ですか?
スパンのクラスがの場合、ContentA、ContentB、および ContentC から各データのデータを取得する方法はsame?

score 1 · Accepted Answer

そのコードにリンクがない場合、DSSのURLオブジェクトのxpathは何ですか？

質問が聞き取れませんでしたが、説明していただけますか？

最初のクラスがない場合に画像ファイルを取得するためのxpathは何ですか？

//tr[1]/td[1]//img/@src

スパンのクラスが同じである場合、ContentA、ContentB、およびContentCから各データのデータを取得するにはどうすればよいですか？

//text()[preceding-sibling::span[@class="style2"]]

django - リンクなしのスクレイピング

1 に答える 1

Related

Reference