Ubuntu で cedergren データ セットを使用した人はいますか。Ubuntu OS を使用しているため、ダウンロードに問題があります。基本的にロジスティック回帰に使用されます
http://nlp.stanford.edu/~manning/courses/ling289/cedegren-varbrul.html
glm func を使用して、このデータセットでどのように機能するかを確認します
どんな助けでも大歓迎です!!
Ubuntu で cedergren データ セットを使用した人はいますか。Ubuntu OS を使用しているため、ダウンロードに問題があります。基本的にロジスティック回帰に使用されます
http://nlp.stanford.edu/~manning/courses/ling289/cedegren-varbrul.html
glm func を使用して、このデータセットでどのように機能するかを確認します
どんな助けでも大歓迎です!!
> require(utils)
> inp <- read.fwf(file=url("http://www-nlp.stanford.edu/~manning/courses/ling236/handouts/panama-mac.tok"),
widths=rep(1, 5), colClasses=c("NULL", rep("factor",4) ) )
> str(inp)
'data.frame': 8955 obs. of 4 variables:
$ V2: Factor w/ 3 levels "0","1","L": 2 2 2 2 2 2 2 2 2 2 ...
$ V3: Factor w/ 6 levels "a","A","d","m",..: 4 4 4 4 4 4 4 4 4 4 ...
$ V4: Factor w/ 4 levels "C","P","S","V": 1 1 1 1 1 1 1 1 1 1 ...
$ V5: Factor w/ 5 levels "1","2","3","4",..: 1 1 1 1 1 1 1 1 1 1 ...
これらの列の名前を変更し、必要に応じて因子のラベルを指定して、これをより自己文書化することができますが、glmデータセットとしてそのまま実行することもできます。