R でマンハッタン プロットを作成しています。ここでの目的は、関連する特性に基づいて SNP を強調することです。
これが私のメイン データフレーム (gwas_plot) の末尾です。
SNP CHR BP P
58008 rs77855001 1 249213034 8.665e-01
58009 rs74322942 1 249218520 7.437e-01
58010 rs114152373 1 249222547 6.504e-02
58011 rs11205304 1 149906423 4.000e-23
58012 rs11205305 1 149906433 2.000e-16
58013 rs1061956 1 149914327 4.000e-06
gwas_plot の SNP のサブセットを含む別のデータセット (gwascat_topsnp) があり、説明が含まれています。次のようになります。
SNP CHR BP P Description
1 rs11205301 1 149906412 4e-23 Height
2 rs11205301 1 149906412 2e-16 Height
3 rs1061954 1 149914353 4e-06 Obesity-related Traits
マンハッタン プロットのソース コード (元のソース コードはこちら: https://github.com/stephenturner/qqman/tree/master/R ) の特定のセクションで、特定の SNP を強調表示できるように変更しました。pch が「説明」カテゴリごとに一意になるように変更しました (上記のデータ フレーム内)。
これは私が追加したセクションです:
keyword2=gwascat_topsnp$Description
# Highlight2: highlight snps from a second character vector
if (!is.null(highlight2)) {
if (any(!(highlight2 %in% d$SNP))) warning("You're trying to highlight SNPs that don't exist in your results.")
d.highlight2=d[which(d$SNP %in% highlight2), ]
with(d.highlight2, points(pos, logp, col="red1", pch=1:24[as.factor(keyword2)], ...))
}
マンハッタン プロットをプロットするために使用するコードは次のとおりです。
par(xpd=T, mar=par()$mar+c(0,0,3,0))
manhattan_KB(gwas_plot,col=c("grey"),highlight=gwas_main[rownum,1],highlight2=gwascat_topsnp$SNP)
par(xpd=TRUE)
legend(0,40,legend=levels(as.factor(keyword2)),
col=c("red1"),pch=1:24[as.factor(keyword2)],
bty="n",cex=0.8,ncol=1,horiz=F)
par(mar=c(5,4,4,2) + 0.1)
ただし、ここに表示される出力では、「高さ」とラベル付けされた説明を持つ両方の SNP は同じ pch を持っている必要がありますが、そうではありません: それらの 1 つには円があり、1 つには三角形があり、他の特性 remians にはラベルが付いていません伝説。
誰かが私が間違っているところを手伝ってくれませんか? さらに情報が必要な場合は、喜んで提供します。
ありがとうございました!