次のようなデータベースから HTML コンテンツを取得するシステムがあります。
<p>This is some text</p>
<p>More text</p>
<p>Third Paragraph</p>
それを表示すると、ブログ投稿コンテンツの短い要約が表示されますが、現在、テキストを表示するときに、文字数の制限を 200 のような数に設定しているため、要約は次のようになります。
<p>This is some text</p>
<p>More text</
任意の場所でコンテンツを切り取って、Web ページの残りの部分を破壊する可能性があります。開いているすべてのタグを閉じるか、特定の数のトップレベルブロックのみを取得する方法は Python にありますか? たとえば、2 つのブロックは最初の 2 つの<p></p>
タグになります。記事の短いプレビューを表示するときに、ワードプレスにこの機能があるのを見てきました。