実際、scrapyを使用していくつかのhtmlページを解析しています。xpathを使用し、いくつかのhtmlタグからアドレスを取得しました。結果は、次の形式になります。
result = ["Hno 4-50, Plot No 301, Swathi Pooja Homes,Beside Rajadhani Theater, Vikas Nagar,Dilsukhnagar,Hyderabad","Mr Sravan"]
そして、私は文字列に参加したいので、私は以下を行いました
final_result = ','.join(result)
次の結果が得られました
final_result = "Hno 4-50, Plot No 301, Swathi Pooja Homes,Beside Rajadhani Theater, Vikas Nagar,Dilsukhnagar,Hyderabad,Mr Sravan"
final_result
ここで、 (アドレス)の名前が最後にあることがわかりますMr Sravan
が、通常、名前はどこの連絡先でもドアまたは家の番号の前にある必要がありますか?したがって、リストに参加した後の文字列の数に関係なく、i開始時に名前を取得する必要がありますが、これを行う方法はありますか?誰かがこれを行う方法を教えてもらえますか?
編集されたコード:
現在、一度に4つのURLを解析しているので、xpath(または関連)を使用して異なるURLからアドレスを取得した場合、結果(たとえば)は各URLについて以下のようになります。
final_result = ['Addess_2','Newyork', 'Mr T.Jamal(Name)']
['Mr T. Jamal(Name)', 'Addres_1','Extra info']
['Addres_3','Mr T. Jamal(Name)','Extra info','Related scope']
['Addres_4','Extra info','Mr T. Jamal(Name)','Related info']
['Addres_5','Extra info','Related info'] # No name
['Addres_6','Extra info1','Related info1'] # No name
ここで、アドレスを解析するすべてのURLについて、上記のすべてのリストで機能するコードを記述します。