41

Web サイトに概要を表示するには、マークダウン テキストをプレーン テキスト形式に変換する必要があります。Pythonでコードが欲しいです。

4

5 に答える 5

47

MarkdownおよびBeautifulSoup (現在はbeautifulsoup4と呼ばれる) モジュールは、あなたが説明したことを行うのに役立ちます。

マークダウンを HTML に変換したら、HTML パーサーを使用してプレーン テキストを取り除くことができます。

コードは次のようになります。

from bs4 import BeautifulSoup
from markdown import markdown

html = markdown(some_html_string)
text = ''.join(BeautifulSoup(html).findAll(text=True))
于 2009-04-17T19:27:32.137 に答える
2

コメントして削除したのは、最終的にここに問題があると思うからです。マークダウン テキストを HTML に変換し、テキストから HTML を削除する方が簡単かもしれません。テキストからマークダウンを効果的に削除する方法は何も知りませんが、HTML からプレーン テキストへのソリューションはたくさんあります。

于 2009-04-17T19:42:56.950 に答える