1

約 56,000 の xml ドキュメントのリストがあり、それぞれを開いて属性を取り出し、別のリスト (csv ファイル) に対して属性値を検証する必要があります。

現時点では、これを使用しています。これは、1 つの xml ドキュメントで機能します。

soup = BeautifulSoup(xmlText)
nameTag = soup.find('instrument', {"name": True})
idTag = soup.find('instrument', {"id": True})
print(idTag['id'] + "," + nameTag['name'])

これにより、アイテムの ID と名前が得られ、他のリストと比較できます。しかし、これらのドキュメントが 56,000 ある場合、これに対処する最善の方法は何でしょうか? 各ドキュメントをダウンロードして BeautifulSoup にロードし、名前と ID を取り出す必要があります。単純な for ループですべてを実行できますか?

よろしくお願いします。

4

1 に答える 1