0

Ubuntu で cedergren データ セットを使用した人はいますか。Ubuntu OS を使用しているため、ダウンロードに問題があります。基本的にロジスティック回帰に使用されます

http://nlp.stanford.edu/~manning/courses/ling289/cedegren-varbrul.html

glm func を使用して、このデータセットでどのように機能するかを確認します

どんな助けでも大歓迎です!!

4

1 に答える 1

0
> require(utils)
> inp <- read.fwf(file=url("http://www-nlp.stanford.edu/~manning/courses/ling236/handouts/panama-mac.tok"), 
                 widths=rep(1, 5), colClasses=c("NULL", rep("factor",4) ) )
> str(inp)
'data.frame':   8955 obs. of  4 variables:
 $ V2: Factor w/ 3 levels "0","1","L": 2 2 2 2 2 2 2 2 2 2 ...
 $ V3: Factor w/ 6 levels "a","A","d","m",..: 4 4 4 4 4 4 4 4 4 4 ...
 $ V4: Factor w/ 4 levels "C","P","S","V": 1 1 1 1 1 1 1 1 1 1 ...
 $ V5: Factor w/ 5 levels "1","2","3","4",..: 1 1 1 1 1 1 1 1 1 1 ...

これらの列の名前を変更し、必要に応じて因子のラベルを指定して、これをより自己文書化することができますが、glmデータセットとしてそのまま実行することもできます。

于 2012-12-28T22:40:58.350 に答える