0

Python と BeautifulSoup を使用して、 Ullmann の工業化学百科事典からすべての章の DOI を抽出したいと考えています。

だからから

<h2 class="meta__title meta__title__margin"><span class="hlFld-Title"><a href="/doi/10.1002/14356007.c01_c01.pub2">Aerogels</a></span></h2>

「Aerogels」と「/doi/full/10.1002/14356007.c01_c01.pub2」を取得したい

より大きなサンプル:

     <ul class="chapter_meta meta__authors rlist--inline comma">
        <li><span class="hlFld-ContribAuthor"><a href="/action/doSearch?ContribAuthorStored=H%C3%BCsing%2C+Nicola"><span>Nicola Hüsing</span></a></span></li>
        <li><span class="hlFld-ContribAuthor"><a href="/action/doSearch?ContribAuthorStored=Schubert%2C+Ulrich"><span>Ulrich Schubert</span></a></span></li>
     </ul><span class="meta__epubDate"><span>First published: </span>15 December 2006</span><div class="content-item-format-links">
        <ul class="rlist--inline separator">
           <li><a title="Abstract" href="/doi/abs/10.1002/14356007.c01_c01.pub2">Abstract</a></li>
           <li><a title="Full text" href="/doi/full/10.1002/14356007.c01_c01.pub2">
                 Full text
                 </a></li>

私が試したタイトルについて:

span['hlFld-Title'].a

私が試したDOIについて:

for link in soup.find_all('a'.title):
    print(link.get('href'))

しかし悲しいことに、私は完全な初心者 (ばか) で、うまくいきません。

URL はhttps://onlinelibrary.wiley.com/browse/book/10.1002/14356007/title?startPage= {1..59} です。

助けてくれてありがとう。

4

1 に答える 1