私は風車を使って Web スクレイピングを試してみましたが、API の waits.forPageLoad は、ページが完全にレンダリングされているかどうかを確認できません。
また、既存の DOM を使用してページをリロードする必要があり、waits.forElement を使用してスクリプトの DOM を検出し、ページがロードされたことを「判断」するシナリオでは。これにより、ページが読み込まれる前であっても DOM が検出されることがあります。
また、Firefox で Windmill テスト クライアントを使用してページを読み込むと、永遠に時間がかかるようです。通常の Firefox ブラウザーで同じページを読み込むと、2 秒ほどかかる場合がありますが、テスト クライアントでは最大 1 分かかる場合があります。こんなに時間がかかるのは普通ですか?
最後に、ウェブスクレイピング用の風車に代わるより良い方法があるかどうか疑問に思っていましたか? ドキュメントは少しまばらなようです。
ご意見をお聞かせください。ありがとう:P