欠損値のあるゲノム データがあり、利用可能な値を使用して各遺伝子ペアの発現レベル間の距離を計算したいと考えています。次に、ギャップを埋めるために K 個の最近傍を発見したいですか? Rでそれを行うにはどうすればよいですか?
gene sample 1 sample 2 sample 3 sample 4
1 5555 NA 2151 5484
2 5564 NA NA NA
3 4544 4656 14546 45455
4 NA 54654 NA NA
... ユークリッド距離を計算するにはどうすればよいですか? 一度に1行だけ使用する必要がありますか?
申し訳ありませんが、私はゲノムデータが初めてで、この情報がどこにも見つかりません。
ありがとう。