0

この記事と他の記事の小見出しを抽出したい: https://www.dr.dk/nyheder/regionale/trekanten/legos-regnskab-viser-tilbagegang

つまり、「Lego har netop præsenteret regnskabet for 2017, og kurven peger nedad.」

ただし、Python モジュールの Newspaper だけではそれができないようです。

何か不足していますか?できる他のモジュールはありますか?読みやすさとhtml2textも試しました。

私のコード:

from newspaper import Article

url = 'https://www.dr.dk/nyheder/regionale/trekanten/legos-regnskab-viser-tilbagegang'
article = Article(url)

article.download()
article.parse()

print (article.title)
print (article.text)
4

1 に答える 1