PythonのBeautifulSoupを使用して、HTMLファイルの段落要素内に表示されているすべてのタグを見つける必要があります。
たとえば、
<p>Many hundreds of named mango <a href="/wiki/Cultivar" title="Cultivar">cultivars</a> exist.</p>
次を返す必要があります。
Many hundreds of cultivars exist.
PS一部のファイルには、抽出する必要のあるUnicode文字(ヒンディー語)が含まれています。
それを行う方法はありますか?