次のようなHTMLリンクが与えられます
<a href="urltxt" class="someclass" close="true">texttxt</a>
URLとテキストを分離するにはどうすればよいですか?
更新
私はBeautifulSoupを使用していますが、その方法がわかりません。
やった
soup = BeautifulSoup.BeautifulSoup(urllib.urlopen(url))
links = soup.findAll('a')
for link in links:
print "link content:", link.content," and attr:",link.attrs
私は得る
*link content: None and attr: [(u'href', u'_redirectGeneric.asp?genericURL=/root /support.asp')]* ...
...
なぜコンテンツが欠落しているのですか?
編集:アドバイスに従って「スタック」について詳しく説明します:)