HTMLページの解析に取り組んでいます。
spynner、selenium、mechanize を試しましたが、このケースでは JavaScript の問題を解決できませんでした。次のページにデータを取得するために、このような問題にどのように対処できるか教えてもらえますか?
私がセレンで作業したとき、このURLでは最初に他の選択ボックスでデータを取得してから続行する必要がありますが、セレンを使用すると、次のページをクリックした後に同じURLしか取得できません。スピナーの場合も同じです。
HTMLページの解析に取り組んでいます。
spynner、selenium、mechanize を試しましたが、このケースでは JavaScript の問題を解決できませんでした。次のページにデータを取得するために、このような問題にどのように対処できるか教えてもらえますか?
私がセレンで作業したとき、このURLでは最初に他の選択ボックスでデータを取得してから続行する必要がありますが、セレンを使用すると、次のページをクリックした後に同じURLしか取得できません。スピナーの場合も同じです。
私が知る限り、mechanize は JavaScript をサポートしていません。そのため、JavaScript の負荷の高いサイトで自動化を行っている場合、機械化はおそらく適切ではありません。むしろ、完全に機能する Web ブラウザーのスクリプトを作成するには、おそらく python が必要です。PyXPCOMを介して Mozilla で、Ruby と WATIR で、または spynner でこれを行うことができます。これらのオプションのうち、spynner は Python とうまく統合されているため、最初に spynner を試してみます。
プロジェクトの成功を祈って、コーディングをお楽しみください!