問題タブ [genetics]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
268 参照

r - 行列の列のペア間の 20 行ごとに関数を適用する

次のような一連の遺伝子 SNP データがあります。

行列のサイズは 56 列 x 46482 行です。最初にマトリックスを 20 行ごとにビンに入れ、次に最初の 8 列 (ファウンダー) のそれぞれを各列 9 ~ 56 と比較し、一致する文字/対立遺伝子の総数を行の総数 (20) で割ります。最終的に、48 8 列 x 2342 行の行列が必要です。これは本質的に類似行列です。次のような方法で、各ペアを個別に抽出しようとしました。

しかし、これはどこにも効率的ではなく、関数を 20 行ごとに複数のペアに適用するより高速な方法を知りません。

上記の例で、20 行にわたって示されているように行がすべて同一である場合、Sample1 の行列の最初の行は次のようになります。

0 投票する
2 に答える
597 参照

r - R を使用して特定の行を抽出する

グループへのメンバーシップを記述する ID のベクトルがあります。各 ID はリストに 1 回だけ表示されます。

例:

V1 の個々の ID (数値として記録)、V2 のグループ ID を含むテーブル (3 列、74985 行、ヘッダーなし) もあります。そして、V3 でのグループの簡単な説明。

例:

各個人は複数のグループに属することができ、各グループには複数の個人を含めることができます。この例では、個人 1 は group に所属して GO:0003674, GO:0005576 and GO:0008150います。

グループ ID がグループ ID のベクトルと一致するすべての行 (つまり、すべてのグループ) をテーブルから抽出して保持したいと思います。最初のベクトルの ID の一部がテーブルに一致しません。マージ機能を使用してみましたが、成功しませんでした。グループに同じ個人が複数回含まれているようです。

0 投票する
1 に答える
3167 参照

r - ゲノミクス マーカー間で発光行列を変更する HMM でのビタビ アルゴリズムの実装

SNP 遺伝子型データに基づいて祖先を割り当てるための隠れマルコフ アプローチの実装について、助けを求めたいと思います。そのように生成された遷移行列があるとします。

発光マトリックスは n 8x4 マトリックスのリストであり、n はデータ内の SNP/行の数に等しくなります。たとえば、3 つの SNP/行にわたる 8 つのサンプル (A1 ~ A8) の次のデータがあるとします。

リストの行列 1 は次のようになります。

7 つのサンプルが行 1 に T を持っているため、各サンプルの確率は 1/7 です。A8 だけが C を持っているため、C を A8 に割り当てる確率は 100% です。行 3 の場合、出力は次のようになります。

前述の遷移行列と放出行列のリストを使用して、対立遺伝子の任意のシーケンスにビタビ アルゴリズムを実装したいと考えています。私が現在持っているコードは、行ごとに異なる放出マトリックスを使用することはできません

0 投票する
4 に答える
1794 参照

r - エクソン/イントロン/utr の一連のゲノム位置をテストする方法は?

次の形式の一連のゲノム位置をテストしたいと思います。

それらがUTRまたはイントロンまたはエクソンまたは遺伝子間配列に位置するかどうかを確認したい. これらの座標がどの遺伝子のイントロン (など) にあるかについての情報は気にしません。

既知の遺伝要素 (エクソンなど) ごとに、ゲノム位置 (各染色体上のゲノムの開始位置と終了位置) が定義されていると想定しています。たとえば、Ensembl にはゲノム内の各エクソンの ID があるため、これがエクソンとイントロンに当てはまることはわかっています。 Mus musclulus の Amy1 遺伝子のエクソンとイントロンの例を参照してください。上記の場所のリストを使用して、そのような場所のデータベースにクエリを実行し、2 つの間に重複がある場合 (理想的には、少なくとも 10bp の重複を指定できる必要がありますが、そうでない場合は問題ありません) 、ヒットするはずです(はい、この領域はエクソン/イントロン/にあります)

そして、ハンディキャップは、私がこれらの場所を数千持っていることであり、理想的にはそれらを一度にクエリし、出力として各場所に「イントロン/エクソン/utr/遺伝子間」が割り当てられるテーブルを用意したいと考えています. 生物はハツカネズミで、位置はゲノム全体からのものです。

どこから始めればよいかわからないため、今のところ、私がやろうとしていることのコードサンプルを提供することはできません.パッケージまたはそれに基づいて構築する何かがあれば、解決策を見つけるのに役立ちます.

Rでできれば完璧ですが、私の知る限り、biomaRtではできず、それを行うためのパッケージが見つかりませんでした。私はGalaxyのことを考えましたが、彼らの自明ではない方法と彼らが生み出す奇妙な出力を考えると、むしろRに固執したいと思います.あなたが知っている悪魔など.

助けていただければ幸いです。

0 投票する
3 に答える
7175 参照

r - SNP ID をゲノム座標にマッピングする

私はいくつかのSNP ID (つまり、rs16828074、rs17232800 など) を持っています。UCSCゲノム Web サイトから Hg19 ゲノムでそれらの座標を取得したいと考えています。

Rこの目標を達成するために使用することをお勧めします。どうやってするか?

0 投票する
7 に答える
9082 参照

r - DNA配列を補完する

DNA配列があるとします。私はそれの補足を取得したい。次のコードを使用しましたが、取得できません。私は何を間違っていますか?