3

PythonでWord文書(.doc、.docx)のページ数を効率的に取得する方法はありますか?

そして、.odtファイルの場合は?

Linux上のWeb2pyをベースにしたWebアプリケーションにこれを使用したいと思います。

ありがとうございました !

4

2 に答える 2

6

このブログエントリを検索する人のみ...

from win32com.client import Dispatch
#open Word
word = Dispatch('Word.Application')
word.Visible = False
word = word.Documents.Open(doc_path)

#get number of sheets
word.Repaginate()
num_of_sheets = word.ComputeStatistics(2)
于 2013-05-22T16:18:00.193 に答える
3

あなたは値を読むことができます

<Properties>
<Pages>CountValue</Pages>

docxパッケージのdocProps/app.xmlからまたは

<office:document-meta>
    <office:meta>
        <meta:document-statistic meta:page-count="CountValue">

odtパッケージでmeta.xmlを作成します。

これらの値が存在しない場合(これらはオプションです)、ドキュメント全体の計算を行う必要があり、実際にはレンダリングを実行する必要がありますが、それははるかに困難です

于 2012-10-19T10:37:34.360 に答える