xpath - Lxml または Xpath コンテンツの印刷

Question

私は次の機能を持っています

def parseTitle(self,  post):
    """
        Returns title string with spaces replaced by dots
    ""        
    return post.xpath('h2')[0].text.replace('.',  ' ')

の内容をご覧いただきたいと思いpostます。考えられることはすべて試しました。

コンテンツを適切にデバッグするにはどうすればよいですか? これは、私がリンクとタイトルをリッピングしている映画の Web サイトであり、この関数はタイトルを解析する必要があります。

H@ が存在しないことは確かですが、これを印刷/デバッグするにはどうすればよいですか?

score 2 · Accepted Answer

postlxml要素ツリーオブジェクトですね。最初に、次を試すことができます：

# import lxml.html # if not yet imported
# (or you can use lxml.etree instead of lxml.html)
print lxml.html.tostring(post)

そうでない場合は、そこから要素ツリーオブジェクトを作成する必要があります。

post = lxml.html.fromstring(post)

または、問題は単に?に置き換える必要があることh2です。//h2

あなたの質問はあまり説明的ではありません..

xpath - Lxml または Xpath コンテンツの印刷

1 に答える 1

Related

Reference