非標準文字を含む Web ページから取得したリストがあります。
リストの例:
[<td class="td-number-nowidth"> 10Â 115 </td>, <td class="td-number-nowidth"> 4Â 635 (46%) </td>, <td class="td-number-nowidth"> 5Â 276 (52%) </td>, ...]
帽子の A はコンマのはずです。リストの最初の値のように値10115を取得できるように、これらを変換または置換する方法を誰かが提案できますか?
ソースコード:
from urllib import urlopen
from bs4 import BeautifulSoup
import re, string
content = urlopen('http://www.worldoftanks.com/community/accounts/1000395103-FrankenTank').read()
soup = BeautifulSoup(content)
BattleStats = soup.find_all('td', 'td-number-nowidth')
print BattleStats
ありがとう、フランク