Python の Beautiful Soup Library を使用して、html ファイルから多数の div を取得し、そこから div 内にある文字列 (金銭的価値) を取得しようとしています。次に、ドル記号を削除して 10 進数に変換し、大なりおよび小なり条件ステートメントを使用して値を比較できるようにします。私はそれをグーグルで調べましたが、このユニコード文字列を10進数値に変換する方法を思い付くことができないようです. 私は本当にここでいくつかの助けを借りることができました. Unicode を 10 進値に変換するにはどうすればよいですか?
これが私の最後の試みでした:
import unicodedata
from bs4 import BeautifulSoup
soup = BeautifulSoup(open("/Users/sm/Documents/python/htmldemo.html"))
for tag in soup.findAll("div",attrs={"itemprop":"price"}) :
val = tag.string
new_val = val[8:]
workable = int(new_val)
if workable > 250:
print(type(workable))
else:
print(type(workable))
編集:
new_val のタイプを出力すると、次のようになります。
print(type(new_val))