Python と BeautifulSoup を使用して、 Ullmann の工業化学百科事典からすべての章の DOI を抽出したいと考えています。
だからから
<h2 class="meta__title meta__title__margin"><span class="hlFld-Title"><a href="/doi/10.1002/14356007.c01_c01.pub2">Aerogels</a></span></h2>
「Aerogels」と「/doi/full/10.1002/14356007.c01_c01.pub2」を取得したい
より大きなサンプル:
<ul class="chapter_meta meta__authors rlist--inline comma">
<li><span class="hlFld-ContribAuthor"><a href="/action/doSearch?ContribAuthorStored=H%C3%BCsing%2C+Nicola"><span>Nicola Hüsing</span></a></span></li>
<li><span class="hlFld-ContribAuthor"><a href="/action/doSearch?ContribAuthorStored=Schubert%2C+Ulrich"><span>Ulrich Schubert</span></a></span></li>
</ul><span class="meta__epubDate"><span>First published: </span>15 December 2006</span><div class="content-item-format-links">
<ul class="rlist--inline separator">
<li><a title="Abstract" href="/doi/abs/10.1002/14356007.c01_c01.pub2">Abstract</a></li>
<li><a title="Full text" href="/doi/full/10.1002/14356007.c01_c01.pub2">
Full text
</a></li>
私が試したタイトルについて:
span['hlFld-Title'].a
私が試したDOIについて:
for link in soup.find_all('a'.title):
print(link.get('href'))
しかし悲しいことに、私は完全な初心者 (ばか) で、うまくいきません。
URL はhttps://onlinelibrary.wiley.com/browse/book/10.1002/14356007/title?startPage= {1..59} です。
助けてくれてありがとう。