1

私は最初の単語の雲を作ろうとしていますが、単純だと思っていたものに少し圧倒されています。テキストの文字列のベクトルがあり、それらから単語の雲を作りたいと思います。2つのアプローチが必要です:(1)すべての文字列をpaste(x、collapse = "")と一緒にマッシュアップし、(これは優先度は低くなりますが)(2)1つの文字列が他の文字列を支配することを望まないのでそのユニークな言葉に重みを1つだけ持たせたいと思います。たとえば、1つの文字列に同じ単語が何度も含まれている場合でも、それを1つとして数えたいと思います。

tmとパッケージを見てきましたwordcloudが、それらはすべて、より複雑なタスク用に設計されているようです。Corpusデータからオブジェクトを作成する方法がわかりません。

どうすれば始められますか?これが役立つ場合のベクトルの例を次に示します。

example <- c("this is a string of text", "another string of text", "one more string of text. This could be a few sentences long", "it looks like string is occurring a lot of times", "I hope this example is long enough. If not I can write more sentences")
4

1 に答える 1

3

ベクトルからコーパスを作成する方法はCorpus(VectorSource(example)). これは私の問題を解決しました

于 2012-06-10T04:18:35.143 に答える