最近、Web-Harvest を Web スクレイピング ツールとして使い始めました。現在、Web サイトへの認証/ログインを行うプロジェクトの開始に取り組んでいます。始める前に、コード内の [URL] が Web ページの実際の URL を置き換えることを明確にしたいと思います。
そのため、次の構成を実行してログイン情報を投稿しようとしています。
<config>
<var-def name="result">
<http method="post" url="[URL]/webreservations/WebObjects/WebReservations.woa/wa/Login?language=1&server=1" multipart="true">
<http-param name="login">[myusername]</http-param>
<http-param name="password">[mypassword]</http-param>
</http>
</var-def>
</config>
結果の情報を取得し、リダイレクトに従うにはどうすればよいですか? 手動でログインすると、以下の拡張子が URL に追加されます。ある種のランダム化とセッション ID が追加されているようです。それは私のソリューションに組み込む必要があるものだと思いますか?
[URL]/nP8oIdbhk8MTXkrQ7Y2Z1g/0.3.0;jsessionid=2EF81CDA9A2EFF0B14E45889BC279BFA
以下は、問題の鍵となるページのソースの一部です。それは WebObjects の問題ですか? JavaScriptの問題ですか?私が問題ですか?:)
<body onload="document.form.login.focus();">
<form name="form" onsubmit="showDiv();return true;" method="post" action="/webreservations/WebObjects/WebReservations.woa/wa/Login">
...
</form>
</body>
どんな助けでも大歓迎です。