ここにこのhtmlがあるとしましょう:
ul_tags = [u'<p>If you\u2019re in the pet food industry:</p><ul><li>What challenges do you face on a regular basis</li><li>What is your biggest struggle </li></ul>''']
それをテキスト ファイルに書き込んで、ファイル内で Web ページのように見えるようにしたいと考えています。
そうです:
import nltk
import codecs
with codecs.open('test.txt', 'a', encoding="utf8") as file:
for tag in ul_tags:
file.write(nltk.clean_html(tag) + '\n')
それがファイルに書き込まれると、次のようになります。
ペットフード業界にいる場合: 定期的に直面する課題は何ですか? 最大の苦労は何ですか?
それは単なるテキスト行です。Web ページ上で元の構造のように見せるにはどうすればよいでしょうか?