4

Python 3.2.3がインストールされたUbuntu12.04 PCに インストールlxmlしました。最新バージョン 3.0Alpha です。easy_installlxml

次のコードを試しました:

import lxml.html

def proc_tweet(ss):
    html=lxml.html.fragment_fromstring(ss)
    ps=html.xpath("//p[@node-type='feed_list_content']")

def test():
    ss=''
    f=open('test')
    for l in f: ss+=l.strip()
    f.close()
    while True: proc_tweet(ss)

if __name__=='__main__':
    test()

ここで、'test' はファイルで、短い HTML フラグメントが含まれています。

<dl action-type="feed_list_item" mid="3409553360609821" class="feed_list W_linecolor"> 
    <dd class="content"> 
        <p node-type="feed_list_content">This is a drill.</p> 
    </dd> 
    <dd class="clear"></dd> 
</dl>

問題はlxml、時間が経つにつれて私の記憶をすべて食べてしまうことです。私はこれを試しました

del ps
del html

うまくいきません。誰でも理由を知っていますか?

4

1 に答える 1

1

これは、3.0 ベータ 1 で修正されたバグです。

今後の参考のために、ソフトウェア ツールの問題は、インターネット上の任意の場所に投稿するのではなく、それを管理しているプロジェクトに直接報告することをお勧めします。ランチパッド バグ トラッカーは、lxml のバグを報告するのに適した場所です。github トラッカーは、主にプル リクエストにのみ使用されます。

于 2012-09-28T18:29:09.810 に答える