みなさん、ファイルにいくつか編集を加えましたが、問題が発生しています。Python コードは、テキスト ドキュメントの行からページ ID を取得し、その ID を URL テンプレートに貼り付けて、結果の XML を解析します。ただし、コードは最後の行を除くすべての行に対して NoneTypes を返しています。したがって、(for ループの前に) ページ ID を出力しますが、for ループ内の情報は出力しません。理由はありますか?
from bs4 import BeautifulSoup
import urllib
with open("list.txt") as f:
for line in f:
link = "http://somewebsite.com/application?number="+line+"&tab=main&xml=ab14"
print "Page ID: "+line
xml_string= urllib.urlopen(link)
result = soup.find('someXML-tag')
if result is not None:
status = result['status']
print "\nApplication Status: "+status+"\n"
else:
print "it was nonetype"
各 XML ドキュメントの形式:
<?xml version="1.0" encoding="UTF-8"?>
<first-XMLtag>
<someXML-tag id="100001" status="OPEN">
</someXML-tag>
</first-XMLtag>
私の出力:
PageID: 100000
it was nonetype
PageID: 100001
it was nonetype
PageID: 100002
Application Status: Open
テキストファイルの行があります。