r - Rで文中の単語の頻度を取得する方法は?

Question

1 つの段落を持つ 1 つの入力ファイルがあります。その段落内の特定の単語の頻度を見つける必要があります。

猫ファイル:

Text    Index
train is good   1
let the train come      5
train is best   3
i m great       3
what is best    2

コード：

 input<-read.table("file",sep="\t",header=TRUE)
 paragraph1<-input[1][1]
 word<-"train"

段落1で「電車」という単語の頻度を見つける必要があります。Rを使用してどのように取得できますか？

score 3 · Accepted Answer

もう少し情報を提供していただければ、おそらくより多くの情報を提供できるでしょう。あなたができることを使用しqdapて：

library(qdap)

dat <- readLines(n=5)
train is good   1
let the train come      5
train is best   3
i m great       3
what is best    2

dat <- do.call(rbind.data.frame, strsplit(dat, "   +"))

colnames(dat) <- c("Text", "Index")

termco(dat$Text, , " train ")

## > termco(dat$Text, , " train ")
##   all word.count     train
## 1 all         16 3(18.75%)

おそらく、すべての段落を一度に行うことができますtermco。詳細については、このリンクtermcoを参照してください。

これの多くは、段落を分けているもの、それをどのように読んでいるか、物事がどのようにインデントされているかなどに依存します.

投稿者は、次の情報が役立つことを発見しました。

length(gregexpr("the", "the dog ate the word the", fixed = TRUE)[[1]])

r - Rで文中の単語の頻度を取得する方法は?

1 に答える 1

Related

Reference