0

これはおそらく非常に単純ですが、フレーズのベクトルがあり、そのうちのいくつかは繰り返され、一部は繰り返されません。最も一般的に発生する順に並べ替えられた一意のフレーズのリストが必要です。

例えば

vec <- c("hello","hi","hi","greetings","good day", "hi", "hello", "good day","good morning","hello","good day")

sort(unique(vec))

[1] "good day"     "good morning" "greetings"    "hello"        "hi"  

最初に「こんにちは」、次に「こんにちは」、「おはようございます」などが続くと思います。

4

1 に答える 1

2

使用するだけsort(table(vec))です:

sort(table(vec), decreasing=TRUE)
# vec
#     good day        hello           hi good morning    greetings 
#            3            3            3            1            1 
于 2013-02-14T11:33:59.437 に答える