string - Rで重複した文字列

Question

私はこのようなdata.frameにベクトルを持っています

language     
Enlish
English, Spanish
English,English
English, Spanish
English,Chinses,Spanish,English
Spanish,Chinese,Spanish
English,Spanish, Chinese
......

このベクトルには 1000 を超える行があり、さまざまな種類の言語が含まれています。重複したものをすべて削除したい.次のようになることを願っています:

language
English,
English,Spanish,
English,
English,Spanish
English,Chinese,Spanish
Spanish,Chinese
English,Spanish, Chinese
......

Rで結果を取得したい.助けてくれてありがとう!

score 2 · Accepted Answer

アプローチは次のとおりです。

あなたのデータ：

language <-readLines(n=7)    
Enlish
English, Spanish
English,English
English, Spanish
English,Chinses,Spanish,English
Spanish,Chinese,Spanish
English,Spanish, Chinese

コード：

lang2 <- strsplit(language, ",\\s*")
## Keep as a list of vectors (more flexible)
lapply(lang2, unique)
## Or paste it together to match your output:
sapply(lapply(lang2, unique), paste, collapse = ",")

## > sapply(lapply(lang2, unique), paste, collapse = ",")
## [1] "Enlish"                  "English,Spanish"        
## [3] "English"                 "English,Spanish"        
## [5] "English,Chinses,Spanish" "Spanish,Chinese"        
## [7] "English,Spanish,Chinese"

string - Rで重複した文字列

1 に答える 1

Related

Reference