1

私はこのウェブページのレビューをこすり取ろうとしています。

http://www.tripadvisor.com/Hotel_Review-g294265-d2309275-Reviews-The_Forest_by_Wangz-Singapore.html

各レビューの唯一の問題は「More」です。これは、OnClickイベントにより多くのテキストをロードします。

例えば:

<span class="taLnk hvrIE6 tr147826763 moreLink" onclick = " ta.util.cookie.setPIDCookie(2247); ta.call('ta.servlet.Reviews.expandReviews', event,this,'review_147826763', '1', 2247)">
More </span>

LXML / BeautifulSoupを使用して完全なレビューテキストを廃棄するにはどうすればよいですか?

4

1 に答える 1

1

これはおそらくあなたが探しているような答えではありませんが、ヘッドレスでスクリプト可能な Webkit ブラウザーを提供する PhantomJS を調べ始めました。あなたが陥ろうとしているどのような ajax リバース エンジニアリングのうさぎの穴よりも簡単な道だと思います...

于 2012-12-27T20:42:57.390 に答える