これはおそらく非常に単純ですが、フレーズのベクトルがあり、そのうちのいくつかは繰り返され、一部は繰り返されません。最も一般的に発生する順に並べ替えられた一意のフレーズのリストが必要です。
例えば
vec <- c("hello","hi","hi","greetings","good day", "hi", "hello", "good day","good morning","hello","good day")
sort(unique(vec))
[1] "good day" "good morning" "greetings" "hello" "hi"
最初に「こんにちは」、次に「こんにちは」、「おはようございます」などが続くと思います。