HTML スクレイピングは、私が見た限りでは十分に文書化されており、その概念と実装を理解していますが、認証フォームの背後に隠れているコンテンツからスクレイピングするための最良の方法は何ですか. 合法的にアクセスできるコンテンツからのスクレイピングについて言及しているため、ログイン データを自動的に送信する方法を探しています。
私が考えることができるのは、プロキシを設定し、手動ログインからスループットを取得し、HTML スクレイピング実行の一部としてそのスループットをスプーフィングするスクリプトを設定することだけです。言語に関する限り、おそらく Perl で行われます。
誰かがこれを経験したことがありますか、それとも単に一般的な考えですか?
編集 これは以前に回答されていますが、.NET を使用しています。それは私がそれを行うべきだと思う方法を検証しますが、これを行うためのPerlスクリプトを持っている人はいますか?