0

このデータを変換したいと思います:

    Sample  Genotype  Region
    sample1    A      Region1
    sample1    B      Region1
    sample1    A      Region1
    sample2    A      Region1
    sample2    A      Region1
    sample3    A      Region1
    sample4    B      Region1

その形式では、複数の遺伝子型を持つ「E」サンプルでタグ付けし、同じ遺伝子型を持つサンプルを 2 回統合します。

    Sample  Genotype  Region   
    sample1    E      Region1
    sample2    A      Region1
    sample3    A      Region1
    sample4    B      Region1

多くのリージョン (Region1 - Regionx) を含む 1 つのリストがあります。Rソフトウェアで行うことは可能ですか? どうもありがとう。

4

1 に答える 1

0

簡単な方法の 1 つは、 を使用することaggregateです。data.frameあなたが「mydf」と呼ばれていると仮定します(そしてJorgのコメントに基づいています):

aggregate(Genotype ~ ., mydf, function(x) {
  a = unique(x)
  ifelse(length(a) > 1, "E", a) 
})
#    Sample  Region Genotype
# 1 sample1 Region1        E
# 2 sample2 Region1        A
# 3 sample3 Region1        A
# 4 sample4 Region1        B
于 2014-03-27T17:01:35.390 に答える