PythonでWord文書(.doc、.docx)のページ数を効率的に取得する方法はありますか?
そして、.odtファイルの場合は?
Linux上のWeb2pyをベースにしたWebアプリケーションにこれを使用したいと思います。
ありがとうございました !
このブログエントリを検索する人のみ...
from win32com.client import Dispatch
#open Word
word = Dispatch('Word.Application')
word.Visible = False
word = word.Documents.Open(doc_path)
#get number of sheets
word.Repaginate()
num_of_sheets = word.ComputeStatistics(2)
あなたは値を読むことができます
<Properties>
<Pages>CountValue</Pages>
docxパッケージのdocProps/app.xmlからまたは
<office:document-meta>
<office:meta>
<meta:document-statistic meta:page-count="CountValue">
odtパッケージでmeta.xmlを作成します。
これらの値が存在しない場合(これらはオプションです)、ドキュメント全体の計算を行う必要があり、実際にはレンダリングを実行する必要がありますが、それははるかに困難です