1

私はR言語にまったく慣れていないので、これを行う方法がよくわかりません。tsv(タブ区切りファイル)があり、次のような方法でテーブルに読み込む場合:

> table <- read.delim(file='test.tsv',sep='\t',header=TRUE,stringsAsFactors=FALSE)

    id              features
1. 131  FeatureA,FeatureB,FeatureC,
2. 132  FeatureA,FeatureD,FeatureE,FeatureF
3. 135  FeatureD,FeatureE,FeatureC
4. 139  FeatureF,FeatureB

機能のクラスタリングを視覚化できるようにしたいのですが、R でこれを活用するには、feature という名前の列のタイプをリストに変更する必要があります。

これを行う最善の方法は何ですか?

4

2 に答える 2

2

you could use strsplit:

table$list.features = strsplit(table$features,",")

you might also want to create indicator variables for these features:

table[unique(unlist(table$list.features))]=0
for (i in 1:nrow(table)) table[i,table$list.features[[i]]]=1
于 2013-12-11T06:37:04.150 に答える