クレジット カード マーチャント データを含むフィールドを含むデータセットがあります。正規表現を使用して値を前処理したい (あいまい一致を使用してフィールドを標準化する前に (「望ましい出力」)、「Clean Value」)
[merchant] [clean value] [desired output]
UPS1Z3734A345 UPS UPS
UPS 1Z68A3125 UPS UPS
HOME DEPOT #3421 HOME DEPOT HOME DEPOT
STAPLES - #123 STAPLES STAPLES
STPLS #4560 STPLS STAPLES
取り組むことができるようにする必要があるさまざまなケースがいくつかあります (たとえば、「-」、数値、「#」文字など)。
私は正規表現ではかなり新しいですが、これは私がこれまでに思いついたものです
(.+)[?=#]
ただし、これは文字列に「#」がある場合にのみ対応します。さらに、文字列に文字以外の文字がない場合、フィールドは空白を返します
この表現を適切に作成する方法について、助けていただければ幸いです。