0

私は生物学的データ、つまり遺伝子のグループを扱っています。例えば:

group 1: geneA geneB geneC
group 2: geneD geneE
group 3: geneF geneG geneH

遺伝子の各ペアについて、2つの遺伝子がどれほど類似しているかを示すスコアがあります(実際には、「方向性」のあるBLASTを使用したため、2つのスコアがあります。最初に他のすべての遺伝子を検索geneXし、次に他のすべての遺伝子を検索しました。 、だから私は2つのスコアを持っていますが、私は2つのスコアの低い方、つまり平均を取ることができると思います)。geneYgeneXgeneYgeneX--geneY

したがって、遺伝子のペアごとにスコアが1つしかない場合を考えてみましょう。私のデータは無向グラフとして表示できます。 代替テキスト

各エッジにスコアが付いていることを思い出してください。

さて、私がやりたいことは次のとおりです。

  1. データをインタラクティブに視覚化します。遺伝子ノードをクリックしてそれらに接続されたリンクを開くことができ、しきい値の上下のエッジのみを表示したり、ネットワークの「拡散」方法を制御したりできます。

  2. 類似したグループ、つまり類似した遺伝子を持つグループをクラスター化します。

どうすればそれができるかについてのアイデアはありますか?これは基本的なクラスタリングだと思います。ここで役立つパッケージ/ソフトウェアに関するヒントをいただければ幸いです。

ありがとうございました。

4

2 に答える 2

1

バイオインフォマティクスのスタックエクスチェンジであるBioStarでこれを尋ねると、おそらくより良い応答が得られるでしょう。具体的には、このスレッドの回答の多くが関連している可能性があります。

有向グラフ(ネットワーク)で生物学的経路を表すのに最適なソフトウェアはどれですか?

于 2010-09-13T13:18:00.300 に答える
0

clutoを試すことができます。トリプル(gene_1、gene_2、類似性)を行列に変換し、「scluster」を使用する必要があります。

于 2010-09-13T08:30:01.973 に答える