1

cummeRbund 関数findSimilar()を使用して、Cuffdiff を使用して特定した発現差のある遺伝子に最も類似した 10 個の遺伝子を見つけました。これは Jensen-Shannon 距離を使用し、ランク付けされた順序付き遺伝子リストを作成しました。これを GO 濃縮についてテストしたいと思います。ファイルは次のようになります。

"XLOC_007917" 0
"XLOC_008881" 0.00417099861122699 
"XLOC_017692" 0.0178758082512721 
"XLOC_008901" 0.0180682577435933 
"XLOC_014267" 0.0333227735282459 
"XLOC_013408" 0.0400392521794019 
"XLOC_013497" 0.0412541820119971 
"XLOC_010554" 0.0453928603025379 
"XLOC_000570" 0.0461264880687295 
"XLOC_010786" 0.0469577467848723 

最初に、最も類似した各遺伝子の GO 用語を手動で検索しましたが、より堅牢な分析を行いたいと考えています。Broad Institute の Java アプリケーションである GSEA を実行しようとしています。

ランク付けされたリスト ファイル形式 (*.rnk) を作成しましたが、遺伝子セット データベースを選択する必要があります。

私は海綿種に取り組んでいるので、既に提供されているデータベースを使用できません。

独自の遺伝子セット データベースを作成するにはどうすればよいですか? それはどのように見えるべきですか?

4

2 に答える 2

0

組み立て支援の後、私の戦略は異なります。Cufflinks を使用して新たに発見された遺伝子の配列を抽出し、CDS を見つけ、BLAST を実行し、GO タームを取得します。もう 1 つのオプションは、既知の ID を持つ遺伝子を使用し、gProfiler を使用して濃縮分析を行うことです。たとえば、分析を行うために Blast2go の無料試用版を入手できます。データベースをローカルにインストールすると、Blast が高速になります。Blast2go で濃縮分析を行うことができます。また、Galaxy のインスタンスをインストールして、Tool Shed リポジトリから Blast2go を取得することもできます。

于 2015-06-17T22:13:51.583 に答える
0

GSEA で動作させるには、ファイルの最初の列に公式のヒト遺伝子記号を遺伝子識別子として含める必要があります。また、各遺伝子がランク付けされたリストに 1 回だけ表示されるようにすることもお勧めします。また、事前ランク付けモードでは、GSEA は入力を常に降順でソートすることに注意してください。

于 2017-12-02T05:53:47.350 に答える