4

python-docxファイルで作業するために、ライブラリとともにpython 3.4を使用してい.docxます。ドキュメントからテキストを抽出できました。しかし、私の目的は、特定のフォントを持つテキストのみを抽出する (そしてそれらを変更する) ことです。

過去 2 日間、ライブラリのドキュメントでこれを検索してきましたが、結果はありませんでした。

ここの誰かがこのライブラリの経験を持っていますか? もしそうなら、彼らは私を正しい方向に向けることができます.

4

1 に答える 1

2

現時点でpython-docxは、スタイルを使用してフォントの書体を適用する機能しかありません。次のような特定のスタイルを持つランを検出できます。

document = Document('having-fonts.docx')
for paragraph in document.paragraphs:
    for run in paragraph.runs:
        if run.style == style_I_want:
            print run.text

段落スタイルを使用して特別なフォントが適用されている場合、これを使用できます。

document = Document('having-fonts.docx')
for paragraph in document.paragraphs:
    if paragraph.style == style_I_want:
        print paragraph.text

詳細を教えていただければ、より具体的にできるかもしれません。

于 2014-09-01T18:32:31.600 に答える