文字列の一部の抽出について質問があります。たとえば、次のような文字列があります。
a <- "DP=26;AN=2;DB=1;AC=1;MQ=56;MZ=0;ST=5:10,7:2;CQ=SYNONYMOUS_CODING;GN=NOC2L;PA=1^1:0.720&2^1:0"
GN=
と の間のすべてを抽出する必要があり;
ますNOC2L
。
それは可能ですか?
注:これはINFO
列形式のVCF ファイル形式です。GN は Gene Name ですので、INFO
列から遺伝子名を抽出したいと思います。