0

lxml と xpath コマンドを使用して、次のスニペットから時刻 (07.12.2012 00:36 Uhr) にアクセスしようとしました。残念ながら、必要な情報は属性ではありません。どの xpath を使用してアクセスできますか?

私のスニペット:

{'class': 'artikeldiskussion-titel'}
<div class="artikeldiskussion-titel"><span id="posting-649631-titel"><b>So</b></span>

    <span id="an_id" style="position: absolute; visibility: hidden; z-index: 999;"    class="hint_grau">

    </span> <span class="anz-postings-user" title="759 Kommentare">(759)</span> &#183;           07.12.2012 00:36 Uhr
</div>
4

2 に答える 2

1

これは厄介なhtmlです。

これ以上サンプルを確認することなく、次の 2 つのアプローチのいずれかをお勧めします。

  1. div の最後のテキスト ノードを取得します。/descendant::div[@class="artikeldiskussion-titel"]/child::text()[position()=last()]
  2. センチネル ノードの後に​​テキスト ノードを取得します。/descendant::span[@class="anz-postings-user"]/following-sibling::text()[1]
于 2012-12-07T15:17:48.373 に答える
0

text()xpath 関数を使用します。

txt = tree.xpath('//path/to/span/text()')
于 2012-12-07T15:08:51.100 に答える