私は現在、site:somedomain.com
PythonとMechanizeを使用してBINGに次のようなサイト検索を行っています。
bing に問題なく送信し、出力を返しています - Json のように見えますか? 結果をさらに解析する良い方法を見つけられないようです。JSONですか?
次のような出力が得られます。
Link(base_url=u'http://www.bing.com/search?q=site%3Asomesite.com', url='http://www.somesite.com/prof.php?pID=478', text='SomeSite - Professor Rating of Louis Scerbo', tag='a', attrs=[('href', 'http://www.somesite.com/prof.php?pID=478'), ('h', 'ID=SERP,5105.1')])Link(base_url=u'http://www.bing.com/search?q=site%3Asomesite.com', url='http://www.somesite.com/prof.php?pID=527', text='SomeSite - Professor Rating of Jahan \xe2\x80\xa6', tag='a', attrs=[('href', 'http://www.somesite.com/prof.php?pID=527'), ('h', 'ID=SERP,5118.1')])Link(base_url=u'http://www.bing.com/search?q=site%3Asomesite.com', url='http://www.somesite.com/prof.php?pID=645', text='SomeSite - Professor Rating of David Kutzik', tag='a', attrs=[('href', 'http://www.somesite.com/prof.php?pID=645'), ('h', 'ID=SERP,5131.1')])
次のようなすべてのURLを取得したい:
http://www.somesite.com/prof.php?pID=478
http://www.somesite.com/prof.php?pID=527
http://www.somesite.com/prof.php?pID=645
など、その中のurl
属性
コード内で mechanize を使用してこれをさらに行うにはどうすればよいですか? 将来、一部の URL は次のようになる可能性があることに注意してください。
http://www.anothersite.com/dir/dir/dir/send.php?pID=100
ありがとうございました !