まず、私がやろうとしているのは、ユーザーに検索用語を尋ねることです。次に、プログラムは yahoo を検索し、最初の結果のリンクを出力します。ここに私がこれまで持っているコードがあります。
from urllib import urlopen
import re, time
from BeautifulSoup import BeautifulSoup
print "What Would You Like to Search For?"
user_input = raw_input('') #Gets Search Term from User
search = "http://search.yahoo.com/search;_ylt=A2KLtaJX_1BQfT4AwX2bvZx4?p=baker&toggle=1&cop=mss&ei=UTF-8&fr=yfp-t-701"
new_search = search.replace('baker', user_input)
content = urlopen( new_search ).read()
soupcontent = BeautifulSoup(content)
link1 = soupcontent.find(id="link-1")
print link1
すべて正常に動作します。ユーザー入力を受け取り、Yahoo を検索します。私が抱えている問題は、「犬」を検索したとしましょう
プログラムは次のように出力します: "a id="link-1" class="yschttl spt" href="http://www.dog.com/" data-bk="5101.1>b>Dog/b > 消耗品 | b>Dog/b> フード、b>Dog/b> ベッド、b>Dog/b> wbr>/wbr>ノミ駆除 & その他 .../a>"
ページの最初のリンクです。ただし、「http://www.dog.com/」のみを印刷したいのですが、これについて誰か助けてもらえますか?
ありがとう。