これらのコードスニペットを含むさまざまなセクションを含むHTMLのページがたくさんあります。
<div class="footnote" id="footnote-1">
<h3>Reference:</h3>
<table cellpadding="0" cellspacing="0" class="floater" style="margin-bottom:0;" width="100%">
<tr>
<td valign="top" width="20px">
<a href="javascript:void(0);" onclick='javascript:toggleFootnote("footnote-1");' title="click to hide this reference">1.</a>
</td>
<td>
<p> blah </p>
</td>
</tr>
</table>
</div>
HTMLを正常に解析し、これらの関連タグを抽出できます
tags = soup.find_all(attrs={"footnote"})
次に、コードスニペットが次のようになるように、これらに関する新しい親タグを追加する必要があります。
<div class="footnote-out"><CODE></div>
しかし、識別されたタグを囲むようにbs4に親タグを追加する方法を見つけることができません。識別されたタグの後にinsert()/insert_beforeアドイン。
私は文字列操作を試すことから始めました:
for tags in soup.find_all(attrs={"footnote"}):
tags = BeautifulSoup("""<div class="footnote-out">"""+str(tags)+("</div>"))
しかし、これは最善のコースではないと思います。
助けてくれてありがとう。bs / bs4を使い始めたばかりですが、これをクラックすることはできません。