1

一塩基多型 (SNP) ID を rs# から SNP_A-# に変換する方法を知っている人はいますか? rs429358 と rs4420638 の 2 つの SNP があり、これらの SNP が別のデータセットに含まれているかどうかを判断する必要があります。データセットは、SNP ID に SNP_A-xxxxx 記号を使用します。どんな助けでも大歓迎です!

4

3 に答える 3

2

biostar に問い合わせてください: http://www.biostars.org/show/questions/

SNP_A### は正式な命名法ではありません。それはどこから来たのですか ?

ID を比較する唯一の方法は、染色体/位置/対立遺伝子参照/対立遺伝子代替を比較することです。

于 2012-08-20T23:09:50.307 に答える
1

SNP_A### 識別子は、Affymetrix SNP ID である可能性が非常に高いです。それらがどのアレイに由来するかを知る必要がありますが、それはおそらくヒトゲノムワイド SNP 6.0 です。

rs# から affyid# へのマッピングを提供する Affymetrix Web サイトから注釈データをダウンロードできます。http://www.affymetrix.com/support/mas/index.affx#1_1から始めてみてください。

Genomewide SNP 6.0 アレイ製品の「ソフトウェアとデータ」の下にある「注釈ファイル」を選択します。

1 つの落とし穴は、アレイ上の一部のプローブセットが冗長であることです。小さなサブセットの場合、複数の affyid# が 1 つの rsid# にマッピングされます。

于 2012-08-21T13:38:25.267 に答える
0

SNP_A* 識別子は Affymetrix SNP ID です。私も似たようなことをしなければなりませんが、もっと大きな規模で.... ここから Affymetrix 注釈ファイル「Genomewide SNP 6.0」を使用しても、思ったほどマッピングされません: http://www.affymetrix. com/support/mas/index.affx#1_1

私がしたことは、Biopython を使用することでした (Python3 で行いました)。まず、pip 経由でbiopythonをインストールする必要があります。

その後、Entrez ライブラリを使用して esearch() メソッドを使用できます。サンプルコードは次のとおりです。

from Bio import Entrez

Entrez.email = '<email address>'
handle = Entrez.esearch(db='snp', retmax='1', sort='SNP_ID', term='<affymetrix id>')
results = Entrez.read(handle)
rsNumber = 'rs'+results['IdList'][0]

これにより、affymetrix id から正しい rs 番号が得られます。

于 2015-03-16T19:07:22.533 に答える