0
  1. 私は風車を使って Web スクレイピングを試してみましたが、API の waits.forPageLoad は、ページが完全にレンダリングされているかどうかを確認できません。

  2. また、既存の DOM を使用してページをリロードする必要があり、waits.forElement を使用してスクリプトの DOM を検出し、ページがロードされたことを「判断」するシナリオでは。これにより、ページが読み込まれる前であっても DOM が検出されることがあります。

  3. また、Firefox で Windmill テスト クライアントを使用してページを読み込むと、永遠に時間がかかるようです。通常の Firefox ブラウザーで同じページを読み込むと、2 秒ほどかかる場合がありますが、テスト クライアントでは最大 1 分かかる場合があります。こんなに時間がかかるのは普通ですか?

  4. 最後に、ウェブスクレイピング用の風車に代わるより良い方法があるかどうか疑問に思っていましたか? ドキュメントは少しまばらなようです。

ご意見をお聞かせください。ありがとう:P

4

1 に答える 1

0
 client.waits.sleep(milliseconds=u'2000')

2 秒間の完全な一時停止。

 client.waits.forPageLoad(timeout=u'20000')

ページが読み込まれるまで、または 20 秒が経過するまで、いずれか早い方の行を待機します。時間境界のあるアサートと考えてください。ページが 20 秒未満で読み込まれた場合は合格、そうでない場合は不合格です。

これが役に立てば幸いです。

TD

于 2012-04-10T17:44:52.070 に答える