1

データベースから URL アドレスを読み込み、各ページをクロールしたいと考えています。したがって、私は解析関数を手動で開始しようとしました 私の問題は、解析関数の応答属性が HtmlResponse (両方: <200 url>) によって呼び出されたものとまったく同じであっても、異なる hxs が生成されることです:応答属性は次のとおりです。

    <HtmlXPathSelector xpath="None data=u'<html lang="de" dir="ltr" class="client-'>

HtmlResponse-Attribute によるものは次のとおりです。

    <HtmlXPathSelector xpath="None data=u'<html>

どうしてこれなの?

Response(url) を取得しようとすると、次のような AttributeError が返されます: 'Response' オブジェクトには属性 'body_as_unicode' がありません

助けてくれてありがとう

4

0 に答える 0