-1

1 つの段落を持つ 1 つの入力ファイルがあります。その段落内の特定の単語の頻度を見つける必要があります。

猫ファイル:

Text    Index
train is good   1
let the train come      5
train is best   3
i m great       3
what is best    2

コード:

 input<-read.table("file",sep="\t",header=TRUE)
 paragraph1<-input[1][1]
 word<-"train"

段落1で「電車」という単語の頻度を見つける必要があります。Rを使用してどのように取得できますか?

4

1 に答える 1

3

もう少し情報を提供していただければ、おそらくより多くの情報を提供できるでしょう。あなたができることを使用しqdapて:

library(qdap)

dat <- readLines(n=5)
train is good   1
let the train come      5
train is best   3
i m great       3
what is best    2

dat <- do.call(rbind.data.frame, strsplit(dat, "   +"))

colnames(dat) <- c("Text", "Index")

termco(dat$Text, , " train ")

## > termco(dat$Text, , " train ")
##   all word.count     train
## 1 all         16 3(18.75%)

おそらく、すべての段落を一度に行うことができますtermco。詳細については、このリンクtermcoを参照してください。

これの多くは、段落を分けているもの、それをどのように読んでいるか、物事がどのようにインデントされているかなどに依存します.

投稿者は、次の情報が役立つことを発見しました。

length(gregexpr("the", "the dog ate the word the", fixed = TRUE)[[1]])

于 2013-03-20T03:01:04.233 に答える