単語をタグに変換するために文を分割したい (で単純な全文検索を行うためMongodb
)、コンマやコロンを保存したくない:
phrase = "hello, this is a simple description!"
pattern = "[\"\'\!\?\:\,\;]"
私はこれを試しました:
re.split(pattern, phrase)
Out[1]: ['hello', ' this is a simple description', ''] # as you can see, i've always blank characters.
「文字以外の文字」をすべて削除したいのですが、phrase.replace(",", " ")
1文字しか置換されません。置換で正規表現を使用するにはどうすればよいですか? ss何かre.remove(pattern, phrase)
、ループしていませんか、これはサーバーに負担がかかりますか?