簡単な質問があります。分析する必要がある data.frame は次のようになります。
a o 34 c 456 d 32 r 21 a s 21 f 78 s z 21 df 4 m 21 t x 2 vb 20 p 34 q 56 g 65 d n 78 oi 43 w 322 y 123 d q 76 gh 0.9 wt 3
次の出力が必要です。
a o 34 c 456 d 32 r 21 s 21 f 78 s z 21 df 4 m 21 t x 2 vb 20 p 34 q 56 g 65 d n 78 oi 43 w 322 y 123 q 76 gh 0.9 wt 3
つまり、「a」で始まる行が複製されるため、単語や数字の順序 (昇順または降順) に関係なく、「a」という名前の 2 番目の行が「a」という名前の最初の行に接続されます。「ド」も同様。関数「テーブル」を使用して、「a」、「s」、「t」、「d」の頻度を考慮してみましたが、Rが初めてなので、頻度を考慮した後は続行できません。
dput(ヘッド(tmp1))
出力:
structure(list(V1 = structure(c(38L, 37L, 14L, 26L, 35L, 9L), .Label = c("AATF",
"C14orf143", "CCDC57", "CLNS1A", "DSCC1", "ENOPH1", "EXOSC2",
"FARSA", "FASN", "FKBP4", "FTSJ3", "GUF1", "HSPA4", "HSPA9",
"IFRD2", "LARP4", "MAZ", "MECR", "NARS2", "NAT10", "NFS1", "NLE1",
"NUP107", "PLA2G12A", "POLD2", "POLR3K", "PPP5C", "PSME3", "RAE1",
"RET", "RNF126", "SFXN1", "SLC24A3", "SLC25A15", "THOP1", "TIMM13",
"TMEM93", "TP53I11", "TRAP1", "WDR18", "WDR61"), class = "factor"),
V2 = structure(c(24L, 21L, 14L, 25L, 27L, 26L),.......), row.names = c(NA, 6L), class = "data.frame")