0

例のように、単語のベクトルで階層を取得したいと思います。

# Start (in reality these will not be right next to each other)

words <- c("hello-world", "hello", "string", "sub-string", "custom-fields", 
           "custom", "hi-hat", "hat") 

# Result

highlevel <- c("hello-world", "sub-string", "custom-fields", "hi-hat")
lowerlevel <- c("hello", "string", "custom", "hat") 

実際には、ビッグデータに直面することになり、これらをグループ化する効率的な方法を探しています。できればそちらもリンクさせていただきたいです。目標は、最初に高レベルの単語を検索し、見つからない場合は低レベルの単語を探すことです。

アイデア?

4

1 に答える 1