python - HTML から PDF へ、Python から正しいフォーマットで

翻译自：https://stackoverflow.com/questions/52801417 2018-10-14T09:47:10.667

427 次

私は Weasyprint と PDFKIT を使用して Web ページを PDF に変換しようとしています。ページの一部を含む PDF を正常に保存しました。weasyprint では、ページから正しい CSS スタイルを取得する方法がわかりません。PDFKIT を使用すると、ページ全体ではなく、サイトのモバイルバージョンを取得しているようです。私はpython 3.6を使用しています。

from urllib.request import Request, urlopen
import webbrowser
import pdfkit
import weasyprint

#pdfkit.from_url('http://google.com', 'out.pdf')

print("started script")
website = 'https://www.bbcgoodfood.com/recipes/3228/chilli-con-carne'
filename = 'savedPDF.pdf'

req = Request(website, headers={'User-Agent': 'Mozilla/5.0'})
print(urlopen(req).getcode())

temp = urlopen(req).getcode()
if temp == 200:
    pdfkit.from_url(website, 'out.pdf')

    weasyprint.HTML(website).write_pdf('/Users/me/Documents/weasyprint.pdf')
    weasyprint.HTML(website).write_pdf(filename,stylesheets=[weasyprint.CSS('https://www.bbcgoodfood.com/sites/default/files/advagg_css/css__pDgD1vQBFL4LZ6AO_Uw8wEc3MBEaHOzbhMtPie685P8__Kxa0k0VBbKvV5-TOMN_kW3S7CrkFMM4Zf0LjDvzMFnk__mXPuNFBZ0nocZLk5Qifty02tMfg-gomArSBCcGw1mLo.css')])

何と接続するかを指定するためのオプションがpdfkitに表示されません。さらに、weasyprint から作成された 2 つの PDF は同一です。

python - HTML から PDF へ、Python から正しいフォーマットで

1 に答える 1

Related

Reference