出力として得られるこの xpath 式を使用して//*[@id='info_box']/p[contains(., 'Drafted')]
います: http://pastebin.com/kRmCadiw (元のフォーマットの元の出力)
私が欲しいのは、最後の の後にすべてのテキストを取得することです<br>
。したがって、使用しました:しかし、単純な ' ' で試しても、 (count(...)=1) でdata(tokenize(//*[@id='info_box']/p[contains(., 'Drafted')], '\s*<br\s*/?>\s*')[last()])
完全なテキストが得られます... わかりません何が足りない!<p>
予想される出力は次のとおりです。Drafted by the San Francisco 49ers in the 2nd round (33rd overall) of the 2005 NFL Draft.