この記事と他の記事の小見出しを抽出したい: https://www.dr.dk/nyheder/regionale/trekanten/legos-regnskab-viser-tilbagegang
つまり、「Lego har netop præsenteret regnskabet for 2017, og kurven peger nedad.」
ただし、Python モジュールの Newspaper だけではそれができないようです。
何か不足していますか?できる他のモジュールはありますか?読みやすさとhtml2textも試しました。
私のコード:
from newspaper import Article
url = 'https://www.dr.dk/nyheder/regionale/trekanten/legos-regnskab-viser-tilbagegang'
article = Article(url)
article.download()
article.parse()
print (article.title)
print (article.text)