-1

クレジット カード マーチャント データを含むフィールドを含むデータセットがあります。正規表現を使用して値を前処理したい (あいまい一致を使用してフィールドを標準化する前に (「望ましい出力」)、「Clean Value」)

[merchant]         [clean value]    [desired output]
UPS1Z3734A345      UPS              UPS
UPS 1Z68A3125      UPS              UPS
HOME DEPOT #3421   HOME DEPOT       HOME DEPOT
STAPLES - #123     STAPLES          STAPLES
STPLS #4560        STPLS            STAPLES

取り組むことができるようにする必要があるさまざまなケースがいくつかあります (たとえば、「-」、数値、「#」文字など)。

私は正規表現ではかなり新しいですが、これは私がこれまでに思いついたものです

(.+)[?=#]

ただし、これは文字列に「#」がある場合にのみ対応します。さらに、文字列に文字以外の文字がない場合、フィールドは空白を返します

この表現を適切に作成する方法について、助けていただければ幸いです。

4

1 に答える 1