私はRでこれを行う方法を理解するために一晩中苦労してきました.
基本的に、次のようなデータセットがあります。
id<-c(1,1,1,2,2,3,3,3,3)
label<-c('a', 'b', 'c', 'b', 'd', 'a', 'c', 'd', 'e')
mydata<-as.data.frame(cbind(id, label))
mydata$id<-as.integer(as.character(mydata$id))
mydata$label<-as.character(mydata$label)
mydata
id label
1 1 a
2 1 b
3 1 c
4 2 b
5 2 d
6 3 a
7 3 c
8 3 d
9 3 e
mydata を mylist に変換して、次のようにします。
mylist<-list()
mylist[[1]]<-c('a', 'b', 'c')
mylist[[2]]<-c( 'b', 'd')
mylist[[3]]<-c( 'a', 'c', 'd', 'e')
mylist
[[1]]
[1] "a" "b" "c"
[[2]]
[1] "b" "d"
[[3]]
[1] "a" "c" "d" "e"
では、mydata から mylist に移動するにはどうすればよいでしょうか。
注: 私の実際のデータフレームには約 200 万行あります。
[背景: 私はマルチラベル分類の問題に取り組んでおり、F1、精度、再現率を計算する必要があります。ラベルは可変です。それらすべてを大きなリストにまとめて、そのように比較できると思いました]