Google の Dataprep ソリューションを使用して、e コマースの製品フィードをクレンジングし始めました。何百もの e コマース ストアからデータを受け取ると、一貫性を保つためにデータをクレンジングし、ブランド名のさまざまなスペルの名前を変更したいと考えています。たとえば、Adidas の綴りが異なる数百万行の列「Vendor」があります。
adidas
アディダス
アディダス クラシック
アディダスオリジナルス
アディダス オリジナルス
アディダス スケートボーディング
アディダス スケートボーディング
私の要件のために、すべての例の名前を「adidas」に変更したいと思います。私は Dataprep のさまざまなルーチンを調べていて、Replace 関数で作業を行うことができましたが、スケーラブルなソリューションではありません。
Dataprep でブランド名のマスター ファイルを取得し、このデータを参照して不適切なインスタンスを置き換える方法はありますか? Excel では、単純な VLOOKUP が機能する可能性があり、これが Dataprep に存在するかどうか疑問に思っています。
上記が理にかなっていることを願っています。助けてくれる人に感謝します。
クレイグ