これに役立つ組み込みのPythonモジュールがたくさんあります。たとえば、urllibとhtmllib。
アプローチ方法を変えると、問題はより簡単になります。「いくつかのフォームに入力し、送信ボタンをクリックして、データをサーバーに送り返し、応答を受信する」と言います。これは4段階のプロセスのように聞こえます。
実際、あなたがする必要があるのは、いくつかのデータをWebサーバーに投稿し、応答を取得することです。
これは次のように簡単です。
>>> import urllib
>>> params = urllib.urlencode({'spam': 1, 'eggs': 2, 'bacon': 0})
>>> f = urllib.urlopen("http://www.musi-cal.com/cgi-bin/query", params)
>>> print f.read()
(urllibドキュメントからの例)。
応答で何をするかは、HTMLがどれほど複雑で、何をしたいかによって異なります。正規表現を使用して解析することで解決できる場合があります。または、htmllib.HTMLParserクラスを使用するか、BeautifulSoupなどのより高レベルのより柔軟なパーサーを使用することもできます。