必要なのは、対応するタグのテキストを取得してデータベースに保持することだけです。xml ファイルが大きい (4.5 GB) ため、sax を使用しています。文字メソッドを使用してテキストを取得し、辞書に入れました。しかし、endElementメソッドでテキストを印刷すると、テキストの代わりに新しい行が表示されます。
これが私のコードです:
def characters(self,content):
text = unescape(content))
self.map[self.tag]=text
def startElement(self, name, attrs):
self.tag = name
def endElement (self, name)
if (name=="sometag")
print self.map[name]
前もって感謝します。