2

非常にノイズの多い文字列入力があり、それをきれいにしようとしています..

したがって、ノイズの多い文字列の一部は次のようになります。

"big $price chair, 5x10"

これで、シンボルの削除とその他の処理が完了しました。しかし、私も削除したいです

  5x10

このために私はこれをしました:

 def remove_numerics(self,string):
    return ' '.join([term for term in string.split() if not term[0].isdigit()])

この事件を解決したのは

しかし、私の文字列が次の場合:

    "big $price chair, x10"

じゃあ失敗?このケースも解決するための良いpythonicの方法は何ですか。どうもありがとう。

4

2 に答える 2

5
re.sub(r'\b[\dx]+\b', '', "big $price chair, 5x10")
于 2012-05-23T17:44:12.073 に答える
4
import re
new_string = re.sub(r', \d*x\d+', '', old_string)
于 2012-05-23T17:44:58.073 に答える