2

データベースから直接取得した遺伝子シンボルの列があり、一部の行にはコンマで区切られた 2 つ以上のシンボルが含まれています (以下の例を参照)。

SLC6A13
ATP5J2-PTCD1,BUD31,PTCD1
ACOT7
BUD31,PDAP1
TTC26

コンマを削除し、区切り記号を次のように新しい行に配置したいと思います。

SLC6A13
ATP5J2-PTCD1
BUD31
PTCD1
ACOT7
BUD3
PDAP1
TTC26

Rでこれを行う簡単な方法を見つけることができませんでした。誰か提案はありますか?

4

2 に答える 2

4

このベクトル結果を使用して、マトリックスまたは data.frame に入れることができます。

vec <- scan(text="SLC6A13
 ATP5J2-PTCD1,BUD31,PTCD1
 ACOT7
 BUD31,PDAP1
 TTC26", what=character(), sep=",")
Read 8 items
 vec
[1] "SLC6A13"      "ATP5J2-PTCD1" "BUD31"        "PTCD1"        "ACOT7"        "BUD31"        "PDAP1"       
[8] "TTC26"       

多分:

 as.matrix(vec)

(このscan関数はファイルから読み取ることもできます。「テキスト」パラメーターは比較的最近追加されたばかりですが、入力の手間が省けますfile=textConnection("...")。)

于 2013-07-11T02:10:39.687 に答える
1

もう 1 つのオプションは、readLinesandを使用することstrsplitです。

unlist(strsplit(readLines(textConnection(txt)),','))
 "SLC6A13"      "ATP5J2-PTCD1" "BUD31"        "PTCD1"        "ACOT7"        
 "BUD31"        "PDAP1"        "TTC26"  
于 2013-07-11T02:16:45.130 に答える