5

PDFの各ページにテキストが必要です。このテキストは、最終的なドキュメントで赤く表示されるように見える html コードです<p style="color: #ff0000">blabla</p>。それを pdf (html2pdf lib) に変換してから、それを (PyPDF2 lib) 私の pdf の各ページにマージします。...しかし、マージは非常に遅いです!

私の質問は次のとおりです:PyPDF2のpage.mergePageメソッドよりもpdfをマージするより速い方法はありますか? (または、この PDF にテキストを追加するより速い方法はありますか?)

ありがとう !(Windows 8 で python 2.7.5 を使用)

4

1 に答える 1

0

ページにテキストを追加するだけなので、ページのコンテンツ ストリームを直接編集するだけで、おそらくプロセスを高速化できます。マージは、プロセスを大幅に遅くするフォント、その他のリソース、トリミング ボックスなどを処理する必要があります。これらのいくつかを実際に変更する必要がある場合、ソリューションはより複雑になります。いくつかのコード例:

TEXT_STREAM = []  # The PS operations describing the creation of your text
def add_text(page):
    "Add the required text to the page."
    contents = page.getContents()
    if contents is None:
        stream = ContentStream(TEXT_STREAM, page.pdf)
    else:
        contents.operations.extend(TEXT_STREAM)
于 2015-06-02T18:46:21.533 に答える