0

RT(リツイート)の頻度を表すdata.frameがあります。私はこのタイプのdata.frameを持っています:

data.frame':368 obs.of 2 variables: $ Var1: Factor w/ 368 levels "1","2","3","4",..: 1 2 3 4 5 6 7 8 9 10 ... $ Freq: int 71482 16111 7720 4555 2949 2053 1620 1210 978 775 ...

「zipfR」パッケージで次のコマンドを使用したい:

gigp_pos <- lnre("gigp",cost="chisq",method="NLM",rt_pos.spc)

次に、このデータ フレームを spc オブジェクトに変換する必要があります。このタイプのオブジェクトは、いくつかの変数 m、v、N、Vm を表現する必要があります。

置いた: Vm<- frq_frq_pos$Freq m<- frq_frq_pos$Var1

しかし、変数 V と変数 N の違いがわかりません。助けてもらえますか?

4

3 に答える 3

0
rt_pos = your data.frame
Vm = rt_pos$Freq
m = 1:length(Vm)
rt_pos.spc = spc(Vm, m)

?spc を使用して詳細を表示することはできません

于 2015-01-28T03:51:40.183 に答える
0

私もzipfRの新しいユーザーですが、使用できると思います

spc(Vm=frq_frq_pos$Freq, m=frq_frq_pos$Var1)

おそらく、Var1 も因数分解したいと思うでしょう。なぜそれが因数なのですか?

  • V = 一意の用語の数 (パッケージでは「タイプ」と呼ばれます); =合計(Vm)
  • N = 観測/発生の総数 (パッケージでは「トークン」と呼ばれます); =合計(Vm*m)
  • spc」はスペクトルを表します。
于 2014-11-14T19:58:49.723 に答える