0

私はPythonの問題で立ち往生しています、見てください。

JS関数を含むページをスクラップする必要がありますが、それは本当の問題ではありません。本当の問題は、必要な情報が関数によって提供されることです。したがって、関数を実行して、HTMLがビルドされることを確認する必要があります。必要なコードを作成し、それに取り組んで必要なものを取得します。

明確にするために、JS関数はHTMLコードを作成しますが、それをスクラップすると、HTML buidを取得せず、JS関数を返すだけです...

私はスクレイピングプロセスにmechanizeとbeautifulSoupを使用しています。必要なHTMLコードを取得するためにJS関数をエミュレートするために何をしなければならないか誰か知っていますか?

前もって感謝します。

4

1 に答える 1

0

JavaScript をサポートするスクラップ フレームワークが必要です。Seleniumはその 1 つで、BeautifulSoup と組み合わせて使用​​すると良い結果が得られました。

Mozilla Firefox で Seleniumを使用する場合は、PyVirtualDisplayを確認することをお勧めします。

于 2012-12-12T02:15:56.483 に答える