Python 3.2.3がインストールされたUbuntu12.04 PCに
インストールlxml
しました。最新バージョン 3.0Alpha です。easy_install
lxml
次のコードを試しました:
import lxml.html
def proc_tweet(ss):
html=lxml.html.fragment_fromstring(ss)
ps=html.xpath("//p[@node-type='feed_list_content']")
def test():
ss=''
f=open('test')
for l in f: ss+=l.strip()
f.close()
while True: proc_tweet(ss)
if __name__=='__main__':
test()
ここで、'test' はファイルで、短い HTML フラグメントが含まれています。
<dl action-type="feed_list_item" mid="3409553360609821" class="feed_list W_linecolor">
<dd class="content">
<p node-type="feed_list_content">This is a drill.</p>
</dd>
<dd class="clear"></dd>
</dl>
問題はlxml
、時間が経つにつれて私の記憶をすべて食べてしまうことです。私はこれを試しました
del ps
del html
うまくいきません。誰でも理由を知っていますか?