問題タブ [genome]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 2 つのファイルをすばやく比較する方法
2 つの座標 (行の 2 番目と 3 番目の単語) を比較して、それらが重なっている場所を確認できるようにする必要があります。さて、私のコードはそれを行いますが、非常に遅くなります。これまでのところ、10000 行のファイルの場合、私のコードには約 2 分かかります。30 億行のファイルに使用する必要がありますが、これには永遠にかかると見積もっています。私のコードをリファクタリングしてもっと速くする方法はありますか?
これまでのところ、私は自分がやりたいことを正確に行うことができます。これはどれですか:
これはデータのサンプルです
前もって感謝します
r - Estimating distance difference between rows (genetic markers)
I would like to calculate the distance between the markers (Name
) in a given chromosome (Chr
). The objects dist1.alldown
(distance downstream) and dist1.allup
(distance upstream) have exactly what I want. However, the below script is computationally inefficient (my real data could contain a milion of markers and this loop is time consuming).
Some ideas or known tools to obtain an efficiently approach? Thank you!
python - DNA 配列からフラグメントを取得する方法
DNA ゲノムを任意の k-mer サイズにカットしたいので、関数 Sliding_DNA(dna_list,size_to_split) を作成しましたが、機能しません。
誰か助けてくれませんか!
変数 pedazos を出力すると、次のようになります。
コード:
r - サンプル シートを提供せずに GEO メチル化 (450k) データセットを読み込むには?
Gene Expression Omnibus (GEO) からいくつかの Illumina 450k メチル化データセットをダウンロードしました
R Bioconductor パッケージの minfi と ChAMP には、「サンプル シート」と呼ばれるものが必要なようです。
GEO のほとんどの TAR ファイルには、このようなサンプル シートが含まれていないようです。.idat ファイルのみが含まれています。
親切な魂が何かアドバイスをくれるでしょうか?サンプル シートなしで ChAMP / Minfi パイプラインを実行する方法を知りたいです。そうでない場合、.idat ファイルからサンプル シートを生成する方法はありますか?
ありがとう!