python - ループ中にNoneTypeを返すPython BeautifulSoup

翻译自：https://stackoverflow.com/questions/17480871 2013-07-05T04:02:22.130

338 次

みなさん、ファイルにいくつか編集を加えましたが、問題が発生しています。Python コードは、テキストドキュメントの行からページ ID を取得し、その ID を URL テンプレートに貼り付けて、結果の XML を解析します。ただし、コードは最後の行を除くすべての行に対して NoneTypes を返しています。したがって、(for ループの前に) ページ ID を出力しますが、for ループ内の情報は出力しません。理由はありますか？

from bs4 import BeautifulSoup
import urllib

    with open("list.txt") as f:
        for line in f:
            link = "http://somewebsite.com/application?number="+line+"&tab=main&xml=ab14"
            print "Page ID: "+line
            xml_string= urllib.urlopen(link)
            result = soup.find('someXML-tag')
            if result is not None:
                status = result['status']
                print "\nApplication Status: "+status+"\n"
            else:
                print "it was nonetype"

各 XML ドキュメントの形式:

    <?xml version="1.0" encoding="UTF-8"?>
    <first-XMLtag>
       <someXML-tag id="100001" status="OPEN">
       </someXML-tag>
    </first-XMLtag>

私の出力：

PageID: 100000
it was nonetype

PageID: 100001
it was nonetype

PageID: 100002
Application Status: Open

テキストファイルの行があります。

python - ループ中にNoneTypeを返すPython BeautifulSoup

1 に答える 1

Related

Reference