1

このウェブサイト用に Python で簡単なパーサーを作成しました。以下は私のコードの一部です。
私の質問は次のとおりです。

  1. だけでなく、p[1]残りも抽出するにはどうすればよいですか...p[2]p[3]
  2. どうすればそれらを互いに分離できますか?

text1 = xmldata.xpath('//p[@class="MsoNormal"][1]//text()')  
a=''  
for i in text1:  
a=a+i.encode('cp1251')  
print a
4

3 に答える 3

0

背景を知らなくても、私はそのようなことしか提案できません:

texts = list();
index = 0;
while(True):
    index += 1;
    try:
        temp = xmldata.xpath('//p[@class="MsoNormal"][%i]//text()' % index);
    except:
        break;
    else:
        texts.append();

このコード ブロックの後に、同じ要素のリストが表示されます。text1

于 2013-10-08T12:11:01.510 に答える