私は生物学的データ、つまり遺伝子のグループを扱っています。例えば:
group 1: geneA geneB geneC
group 2: geneD geneE
group 3: geneF geneG geneH
遺伝子の各ペアについて、2つの遺伝子がどれほど類似しているかを示すスコアがあります(実際には、「方向性」のあるBLASTを使用したため、2つのスコアがあります。最初に他のすべての遺伝子を検索geneX
し、次に他のすべての遺伝子を検索しました。 、だから私は2つのスコアを持っていますが、私は2つのスコアの低い方、つまり平均を取ることができると思います)。geneY
geneX
geneY
geneX--geneY
したがって、遺伝子のペアごとにスコアが1つしかない場合を考えてみましょう。私のデータは無向グラフとして表示できます。
各エッジにスコアが付いていることを思い出してください。
さて、私がやりたいことは次のとおりです。
データをインタラクティブに視覚化します。遺伝子ノードをクリックしてそれらに接続されたリンクを開くことができ、しきい値の上下のエッジのみを表示したり、ネットワークの「拡散」方法を制御したりできます。
類似したグループ、つまり類似した遺伝子を持つグループをクラスター化します。
どうすればそれができるかについてのアイデアはありますか?これは基本的なクラスタリングだと思います。ここで役立つパッケージ/ソフトウェアに関するヒントをいただければ幸いです。
ありがとうございました。