Webスクレイピング中に文字列からカンマを取り除くのに問題があります。私のコードは次のとおりです。
import urllib
import re
htmlfile = urllib.urlopen ("http://example.com")
htmltext = htmlfile.read ()
regex = 'Posts: (.+?)\n'
value = re.compile(regex)
posts = re.findall(value,htmltext)
print posts[0]
これでデータは正常に取得できましたが、問題は、投稿数が 1,092,391 などの値のコンマで減少していることです。1092391 などの数値を残すためにコンマを削除したいと考えています。
私は Python 2.7.1 をインストールしましたが、ここで見つけたものは何もありませんでしたし、Google も機能していないようです。私は少し初心者なので、ここでばかげたことを見逃していることは間違いありませんが、学ぶことと手を汚すことが大好きです。そのため、どんな助けでも大歓迎です。