私は最初の単語の雲を作ろうとしていますが、単純だと思っていたものに少し圧倒されています。テキストの文字列のベクトルがあり、それらから単語の雲を作りたいと思います。2つのアプローチが必要です:(1)すべての文字列をpaste(x、collapse = "")と一緒にマッシュアップし、(これは優先度は低くなりますが)(2)1つの文字列が他の文字列を支配することを望まないのでそのユニークな言葉に重みを1つだけ持たせたいと思います。たとえば、1つの文字列に同じ単語が何度も含まれている場合でも、それを1つとして数えたいと思います。
tm
とパッケージを見てきましたwordcloud
が、それらはすべて、より複雑なタスク用に設計されているようです。Corpus
データからオブジェクトを作成する方法がわかりません。
どうすれば始められますか?これが役立つ場合のベクトルの例を次に示します。
example <- c("this is a string of text", "another string of text", "one more string of text. This could be a few sentences long", "it looks like string is occurring a lot of times", "I hope this example is long enough. If not I can write more sentences")