1

Python で odt xml ファイルを正常に取得していますが、xml ファイル データを取得する方法がわかりません。

odt xml ファイル データを取得するための手法はあります。

ここでodt xmlファイルを抽出するための私のコード

#!/usr/lib/python2.7

import sys, zipfile

if len(sys.argv) < 2:
    print "input.odt & output.xml"
    sys.exit(0)

content=""
myfile = zipfile.ZipFile(sys.argv[1])
listoffiles = myfile.infolist()
for s in listoffiles:
    if s.orig_filename == 'content.xml':
        fd = open(sys.argv[2],'w')
        content = myfile.read(s.orig_filename)
        fd.write(content)
        fd.close()
4

1 に答える 1

2

Any techniques are there for pulling the odt xml file data.この xml ファイルの内容を解析することに興味があると思います。そんな方にはBeautifulSoupがおすすめです。BS は html 解析を目的としていますが、xml データを受け入れるように変更できます。

BS4:

from bs4 import BeautifulSoup

soup = Beautifulsoup(<xml file contents>, 'xml')

美しいスープ 3:

from BeautifulSoup import BeautifulStoneSoup

soup = BeautifulStoneSoup(<xml file contents>)

ここから、ドキュメントに従ってデータを解析できます (上記のリンク)。

于 2013-03-26T04:54:21.417 に答える