私はPythonを初めて使用し、次のコードを使用して、.xmlファイル内の場所として識別されるすべてのトークンを.txtファイルに出力しようとしています。
from bs4 import BeautifulSoup
soup = BeautifulSoup(open('exercise-ner.xml', 'r'))
tokenlist = soup.find_all('token')
output = ''
for x in tokenlist:
readeachtoken = x.ner.encode_contents()
checktoseeifthetokenisalocation = x.ner.encode_contents().find("LOCATION")
if checktoseeifthetokenisalocation != -1:
output += "\n%s" % x.word.encode_contents()
z = open('exercise-places.txt','w')
z.write(output)
z.close()
プログラムは動作し、場所であるすべてのトークンのリストを吐き出します。各トークンは、出力ファイルの独自の行に出力されます。しかし、私がやりたいのは、美しいスープが場所として識別される2つ以上の隣接するトークンを見つけるたびに、それらのトークンを出力ファイルの同じ行に出力できるようにプログラムを変更することです。これを達成するためにコードを変更する方法を誰かが知っていますか?私はあなたが提供することができるかもしれないどんな提案にも完全に感謝するでしょう。