Pythonを使用してHTMLコードから特定の情報を抽出しようとしています。例えば:
<a href="#tips">Visit the Useful Tips Section</a>
and I would like to get result : Visit the Useful Tips Section
<div id="menu" style="background-color:#FFD700;height:200px;width:100px;float:left;">
<b>Menu</b><br />
HTML<br />
CSS<br />
and I would like to get Menu HTML CSS
つまり、<>と<>の間のすべてを取得したいのですが、htmlコードを文字列として受け取るPython関数を作成し、そこから情報を抽出しようとしています。string.split('<')でスタックしています。