次のように書かれたリンクを抽出しようとしています。
<h2 class="section-heading">
<a href="http://www.nytimes.com/pages/arts/index.html">Arts »</a>
</h2>
私のコードは次のとおりです。
from bs4 import BeautifulSoup
import requests, re
def get_data():
url='http://www.nytimes.com/'
s_code=requests.get(url)
plain_text = s_code.text
soup = BeautifulSoup(plain_text)
head_links=soup.findAll('h2', {'class':'section-heading'})
for n in head_links :
a = n.find('a')
print a
print n.get['href']
#print a['href']
#print n.get('href')
#headings=n.text
#links = n.get('href')
#print headings, links
get_data()
「print a」のようなものは、単にie<a>
内の行全体を出力します。<h2 class=section-heading>
<a href="http://www.nytimes.com/pages/world/index.html">World »</a>
しかし、「print n.get ['href']」を実行すると、エラーが発生します。
print n.get['href']
TypeError: 'instancemethod' object has no attribute '__getitem__'
ここで何か間違ったことをしていますか?助けてください
ここで同様のケースの質問が見つかりませんでした。私の問題はここでは少し独特です。特定のクラス名のセクション見出し内にあるリンクを抽出しようとしています。