1

他の投稿でこれに対する答えを見つけようとしましたが、何も機能していないようです。

私は、自由回答形式を使用して、人々が住んでいた都市に回答したデータセットを持っています。したがって、都市ごとに、人々はさまざまな方法で特定しました。たとえば、アトランタに住んでいる人は、"Atlanta"、"atlanta"、"Atlanta, GA" などと書いたかもしれません。

このデータ セットには 12 の都市が含まれています。各都市が一貫して記述されるように、この変数をクリーンアップしようとしています。各都市でこれを効率的に行う方法はありますか? mutate_if と str_replace_all を試しましたが、理解できないようです (以下のコードを参照)

all_data_city <- mutate_if(all_data_city, is.character, 
                str_replace_all, pattern = "Atlanta, GA",  
                replacement = "Atlanta")
all_data_city %>%
  str_replace_all(c("Atlanta, GA" & "HCA Atlanta" & "HCC Atlanta" &
                      "Suwanee" & "Suwanee, GA" & "suwanee"), = "Atlanta")
4

2 に答える 2