1

このウェブページをPythonで読みたい

http://www.hm.com/us/subdepartment/LADIES?Nr=4294962278#Nr=4294962278&size=100

Webページのソースコードには、24の製品URLしかありません(http://www.hm.com/us/product.*)

Webページ自体(ソースではない)にいる間、24を超える製品が表示されます。

最初の24個だけでなく、すべての製品を読み取るにはどうすればよいですか?

それはおそらくCSSとURLのパラメータと関係がありますが、私はこれについてあまりよく知らないので、誰かが助けてくれれば幸いです。

ありがとうございました。

4

2 に答える 2

0

使用できるのは、Python用のSelenium WebDriverバインディングであり、WebDriverに問題のページにアクセスさせて、プログラムでページにアクセスできるようにします。これは、 Pythonとドキュメントを使用したWebDriverに適しています。

于 2012-10-17T08:40:58.597 に答える
0

残りはjavascriptによって読み込まれます。これはクライアント側であるため、ソースを表示すると元の24しかありません。javascriptを無効にしてからページを表示すると、最初の数個しか表示されません。

Python用のJSレンダラーがない限り、運が悪いかもしれませんか?

それか、代わりにjavascriptが行うのと同じページを呼び出します

于 2012-10-17T08:27:21.217 に答える