私はこのサイトもクラスター分析も初めてなので、規約に違反していたら申し訳ありません。
Cluster 3.0 を使用して、ユークリッド距離と平均リンケージを使用した階層クラスター分析を実行しています。クラスター 3.0 は、遺伝子とそれらの類似性スコアを結合するノードを含む .gtr ファイルを出力します。.gtr ファイルの最初の行は、常に遺伝子を別の遺伝子にリンクし、その後に類似性スコアが続くことに気付きました。しかし、この類似性スコアを再現するにはどうすればよいでしょうか?
私のデータ セットには 8 つの遺伝子があり、d_{ij} に遺伝子 i と遺伝子 j の間のユークリッド距離が含まれる距離行列を作成します。次に、各要素をマトリックスの最大値で割って、マトリックスを正規化します。類似性マトリックスを取得するために、1 からすべての要素を減算します。ただし、結果はリンケージ タイプを使用せず、出力類似性スコアとは異なります。
私は主に、連鎖が最初のノードの類似性 (2 つの最も近い遺伝子の結合) にどのように影響するか、および類似性スコアを計算する方法について混乱しています。
ありがとうございました!