問題タブ [vcf-variant-call-format]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
4799 参照

csv - Plink: データのサブセットを txt または csv にエクスポートします

PLINK で GWAS を実行しました。今度は、snps.txt.

.txtこれらの特定の SNP のデータを PLINK からまたは.csvファイルにエクスポートしたいと考えています。理想的には、このファイルには個々の ID とこれらの SNP の遺伝子型が含まれているため、後で表現型ファイルとマージして、追加の分析とプロットを実行できます。

それを行う簡単な方法はありますか?--extract特定の SNP のみを要求するために使用できることはわかっていますが、データを「エクスポート可能な」テキストベースの形式にエクスポートするように PLINK に指示する方法が見つかりません。

0 投票する
1 に答える
617 参照

r - 次世代シーケンシング vcf ファイルに R を使用する

R初心者です。R を使用して大規模な次世代シーケンシング vcf ファイルを分析していますが、問題が発生しています。非常に大きな vcf ファイルをデータ フレーム (177 変数の 2446824 観測値) としてインポートし、関心のある 3 つのサンプル (29 変数の 2446824 観測値) だけでサブセットを作成しました。

ここで、次元をさらに減らしたいと考えています (行を約 200000 に減らします)。grep を使用しようとしていますが、動作させることができません。私が得るエラーは

これは、私が作業しているファイルの小さな例です。

このデータセットの行を減らす方法は 2 つあります。

コード 1. $Run.Sample1 または $Run.Sample2 または $Run.Sample3 のいずれかに「0/1」または「1/0」または「1/1」が含まれている場合、行全体を保持します。

コード 2. $Run.Sample1 または $Run.Sample2 に「0/1」または「1/0」または「1/1」が含まれ、$Run.Sample3 に「0/0」が含まれる場合、行全体を保持します。

コード 1 から取得したい結果は次のとおりです。

コード 2 から取得したい結果は次のとおりです。

助けてくれて本当にありがとうございます

ケリー

0 投票する
1 に答える
180 参照

linux - Linux での vcftools ファイルのリダイレクト - ヒント

これは、特定の地域から VCF ファイルを取得し、tabixvcftools の「keep」オプションを使用して特定の (ヨーロッパの) 人口をフィルタリングするコードです。

問題: recode.vcfファイルを作成しますが、temp2 ファイルが空であるため、リダイレクトが行われません。

0 投票する
1 に答える
476 参照

bioinformatics - vcf-consensus スクリプト エラー: fasta ファイルにシーケンス N が見つかりません

簡単な例でこのスクリプト ( vcf-consensus ) を使用しようとしていますが、エラーが 1 つあります: シーケンス "7" が fasta ファイルに見つかりません。

構文は次のとおりです。

私のFASTAファイルは次のとおりです。

私のVCFファイルは次のとおりです。

VCF ファイルを bgzip で圧縮し、tabix でインデックスを作成します。

そして、私は実行します:

次のエラーが表示されます: シーケンス "7" が fasta ファイルに見つかりません。

誰か知っていますか?

ありがとう。

0 投票する
1 に答える
1630 参照

r - RのゲノムVCFファイルでPCA、距離行列、およびその他の数学手順を実行する方法は?

VCF (バリアント コール ファイル) を処理してプロットとレポートを作成する方法を学んでいます。これは、私には不明な理由でクラッシュする R コードです。それを修正する方法をアドバイスし、適切なチュートリアルを教えてください。

0 投票する
1 に答える
1175 参照

bioinformatics - Vcftools での Weir-Fst からの分散成分の外挿

上記のスクリプトは、Weir と Cokerham の 1984 年の式を使用して、1000 のゲノム人口データの Fst 距離を計算します。この式は、3 つの分散成分、すなわち a、b、c (集団間、集団内の個体間、集団内の個体内の配偶子間) を使用します。

出力は式の結果を直接提供しますが、最終結果に到達するためにプログラムが計算したコンポーネントは提供しません。Vcftools に a、b、c の値を出力させるにはどうすればよいですか?

0 投票する
1 に答える
129 参照

python - Linux環境で1つの列の値をすべての列と比較する

だから私は2つのファイルを持っています.1つのVCFは次のようになります

次のような遺伝子を持つ別の

2番目のファイルの2番目と3番目の位置の範囲内に遺伝子の位置(VCFファイルの3列目)があるかどうかを見て、それを印刷するスクリプトが必要です。

私がこれまでに行ったことは、ファイルに参加して行うことでした

私がしたことは、結合されたファイルの現在の行のみを比較することです (値が同じ行にある場合にのみ印刷されます)。列 3 のすべての行を列 12 および 13 のすべての行と比較するにはどうすればよいですか?

ベスト、セルグ