あなたはこのようなことを試すことができます。
from BeautifulSoup import BeautifulSoup
def getPrintUnicode(soup):
body=''
if isinstance(soup, unicode):
soup = soup.replace(''',"'")
soup = soup.replace('"','"')
soup = soup.replace(' ',' ')
soup = soup.replace('>','>')
soup = soup.replace('<','<')
body = body + soup
else:
if not soup.contents:
return ''
con_list = soup.contents
for con in con_list:
body = body + getPrintUnicode(con)
return body
print getPrintUnicode(BeautifulSoup('<td class="ln">15</td><td class="sf3b2"><code> </code></td>'))
このgetPrintUnicode()関数は、ページ全体のスープで使用できます。完全なコンテンツが返されます。例外を使用して、文字列を整数に変換します。例えば。
print int(getPrintUnicode(BeautifulSoup('<td class="ln">15</td><td class="sf3b2"><code> </code></td>')))