Google 検索では、HTML で次の最初の結果が得られます。
<h3 class="r"><a href="https://rads.stackoverflow.com/amzn/click/com/0470284889" rel="nofollow noreferrer" class="l vst" onmousedown="return rwt(this,'','','','1','AFQjCNEv1W9YC2jcSKYdEo2kNqBMJ-Utmg','k89K9hF4cVNpxQYHtEKiUQ','0CCoQFjAA',null,event)"><em>Quantitative Trading</em>: <em>How to Build Your Own Algorithmic</em> <b>...</b> - Amazon</a></h3>
このリンクhttp://www.amazon.com/Quantitative-Trading-Build-Algorithmic-Business/dp/0470284889を抽出したいのですが、美しいスープを使用して情報を抽出すると、
soup.find("h3").find("a").get("href")
代わりに次の文字列を取得します。
リンクがそこにあることはわかっており、/url?q= と & 記号の後のすべてを削除することで解析できましたが、よりクリーンな解決策があるかどうか疑問に思っていました。
ありがとう!