問題タブ [vcftools]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
bash - Bashのトラブルシューティング:有効な識別子ではありません
ここでの初心者は、bashでパイプラインを機能させようとしています。私が以下を実行したときに誰かが理由を理解できれば、私は次のようになります。
それは本当に役に立ちます。また、他に間違いがある場合はお知らせください
アイデアは、regionstextfile(ゲノム座標を含む)の各行に対して、ファイルで呼び出さtabix
れたプログラムを実行し、次に指定されたオプションで出力を実行し、すべての出力をファイルに入れることです。vcf.bz
vcftools
genomesregions.txt
perl - Ubuntu および tabix で実行する Perl ファイルの準備
Ubunto や Perl については知りませんが、プログラムをインストールして実行する必要があります。これは私が見ているものです: http://vcftools.sourceforge.net/docs.html
インストールセクションでは、次のように述べています。
vcftools 実行可能ファイルをビルドするには、vcftools フォルダーに「make」と入力します。
Perl スクリプトでは、VCF ファイルが bgzip で圧縮され、tabix でインデックスが作成されている必要があります (どちらのツールも tabix パッケージに含まれており、ここからダウンロードできます)。どちらのツールも、PATH 環境変数にリストされているディレクトリーにある必要があります。Perl スクリプトを実行するには、PERL5LIB 環境変数を設定して、Vcf.pm モジュールを含める必要があります。
export PERL5LIB=/path/to/your/installation/perl
わかりました、VCFtoolsフォルダーを抽出してubuntuのホームフォルダーにコピーしました。次に、「make」と言ってエラーが発生したので、そのtabidxツールをダウンロードしましたが、この時点から、どうすればよいかわかりません。わかりましたtabidxをダウンロードしますが、次に何をどのように行うべきですか?
ありがとう。
zlib - Linux Makefile:'gzbuffer'への未定義の参照(ここでLIB = -lz)
Makefileが次のように読み取るプログラム( vcftools )をインストールしようとしています。
このMakefileを正しく実行することができませんでしたが、代わりに次のようなエラーが発生します。
問題の一部は、zlibのインストールパスに関連するエラーがあることだと思います。-Iパスと-Lパスをzlibのインストールに一致するように変更しようとしましたが、うまくいきませんでした(zlibファイルが含まれているように見えるフォルダーがたくさんあります)。
さらに、このプログラムに関連する他のフォーラム(ここ)を検索すると、zlib1g-devが必要になる可能性があります。zlib1g-devは私のコンピューター上にあります(ubuntuソフトウェアセンターに表示されます)が、次のように入力しても表示されません。
zlibを削除して再インストールすることを検討しましたが、いくつかのプログラムがそれに依存しているようです。インストールまたは削除を実行しようとすると、次のメッセージが表示されます。
sudo apt-get installzlib-devel
問題が私のコンピューターのどこにzlibがインストールされているのか、インストールのエラーなのか、それとも完全に頭上にあるのかはわかりません。任意の提案をいただければ幸いです。ありがとうございました。
r - 数 R を抽出した後、2 つの列からより高い値を選択します。
次のような2つの列(6&7)を持つデータフレーム(8つの変数の451 obs)があります:
これをまとめたコラムを1つ作りたいと思います。これを行うには、各セルの文字は気にしませんが、行が何であっても、より大きな数字を残しておいてください。つまり、次のようにしたいです。
必須ではありませんが、私が何をしているのか疑問に思っている人のために、これは VCFtools というプログラムからの出力です。VCF 内の対立遺伝子をカウントするカウント機能がありますが、明らかにより一般的である場合、対立遺伝子を「マイナー」と名付けることがあります。
ご協力いただきありがとうございます!
bioinformatics - vcf から ped 形式へ: 非 dbSNP の再定義
vcf ファイルを ped 形式に変換するとき (vcftools または 1000G の vcf から ped コンバーターを使用)、dbSNP ID を持たないバリアントの ID がそのバリアントの塩基対の位置を取得するという問題に遭遇します。 IDとして。いくつかのバリアントの例:
ただし、dbSNP ID のないバリアントでは、"chr:basepairposition" の形式を取得したいと考えています。したがって、上記の例は次のようになります。
dbSNP ID のないバリアントのこの 2 番目の列を変更するために、どのコマンドまたはどのスクリプトを使用する必要があるかを誰かが説明してくれると助かります。
ありがとう!
bash - ペアワイズ比較用の Bash スクリプト
私のファイルでペアワイズ計算を行う bash スクリプトを書きたいと思います。
ディレクトリ内に固定ファイルと、ペアごとの比較に使用する一連のファイルがあります。
例えば:
固定ファイルの名前は次のとおりです: Genome.vcf すべてが 1 つのディレクトリにあるペアワイズ計算のファイルの名前: ind_GER、ind_ENG、ind_MRO
次のスクリプトを思いつきました。
私が得るエラーは次のとおりです。
明らかに、私は何か間違っています。これを手伝ってくれたらとてもありがたいです、ありがとう。
linux - Linux での vcftools ファイルのリダイレクト - ヒント
これは、特定の地域から VCF ファイルを取得し、tabix
vcftools の「keep」オプションを使用して特定の (ヨーロッパの) 人口をフィルタリングするコードです。
問題: recode.vcfファイルを作成しますが、temp2 ファイルが空であるため、リダイレクトが行われません。
bioinformatics - Vcftools での Weir-Fst からの分散成分の外挿
上記のスクリプトは、Weir と Cokerham の 1984 年の式を使用して、1000 のゲノム人口データの Fst 距離を計算します。この式は、3 つの分散成分、すなわち a、b、c (集団間、集団内の個体間、集団内の個体内の配偶子間) を使用します。
出力は式の結果を直接提供しますが、最終結果に到達するためにプログラムが計算したコンポーネントは提供しません。Vcftools に a、b、c の値を出力させるにはどうすればよいですか?