xpathを使用してクロールしているHTMLWebページがあります。etree.tostring
特定のノードのは私にこの文字列を与えます:
<script>
<!--
function escramble_758(){
var a,b,c
a='+1 '
b='84-'
a+='425-'
b+='7450'
c='9'
document.write(a+c+b)
}
escramble_758()
//-->
</script>
の出力が必要ですescramble_758()
。全体を理解するために正規表現を書くことはできますが、コードを整理しておく必要があります。最良の選択肢は何ですか?
次のライブラリを圧縮していますが、正確な解決策が見つかりませんでした。それらのほとんどはブラウザをエミュレートしようとしており、カタツムリを遅くしています。
- http://code.google.com/p/python-spidermonkey/(明確に言う
it's not yet possible to call a function defined in Javascript
) - http://code.google.com/p/webscraping/(Javascriptには何も表示されません、間違っている可能性があります)
- http://pypi.python.org/pypi/selenium(エミュレートブラウザ)
編集:例は素晴らしいでしょう..(barebonesは行います)