問題タブ [genetics]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
3 に答える
154 参照

python - リスト内の文字列をアルファベット順および大文字と小文字で並べ替えます

forループ内にリストがあり、itertools.product()さまざまな文字の組み合わせを見つけるために使用します。アイテムの出現回数をカウントするために使用したいのですcollections.Counter()が、今のところ、「A」と「G」のさまざまな組み合わせがすべて出力されます。

さて、これがすべてではありませんが、ご覧のとおり、順序は異なっていても同じものがいくつかあります。次に例を示します。

私は後者の順序を好むので、小文字の前に大文字を含むすべての組み合わせを印刷する方法を見つけたいと思います。また、「a」は「g」の前にあるため、アルファベット順でもあります。最終製品は のようになります['AaGG', 'aaGg', etc]。どの関数を使用すればよいですか?

これは、データを生成するコードです。「カウント」とマークされたセクションは、私が問題を抱えているものです。

0 投票する
2 に答える
58 参照

algorithm - 遺伝学の重複データに適したアルゴリズムはどれですか?

私の質問は、私のデータセットに最適なアルゴリズムを見つけることに関連しています。

個人、疾患、およびテストスコアの 3 つの列を持つデータがあります (テストスコアの特徴は 50 ありますが、ここではテストスコアの特徴は 1 つだけです)。私は3000人の個人を抱えており、疾患の特徴の可能な値はdisA、disB、およびdisCであり、テストスコアは離散変数です。病気の特徴は私のクラス属性です。

1 人の個人が最大 3 つの異なる病気にかかる可能性がありますが、テスト スコア値は 1 つだけです。私の目的は、病気に基づいてテスト スコアを分類することです (どのテスト スコアがどの病気に関連付けられているか)。たとえば、個々の aa (すべての disA、disB、disC を含む) のテスト スコアは 12 です。すると、分析ファイルは次のようになります。

これは偏った分析につながります。そのようなタイプのデータに対するデータ マイニング アルゴリズムまたは統計テストはありますか? これらの患者はデータ セットの中で最も割合が高いため、削除できません。

0 投票する
4 に答える
1298 参照

r - サンプル シートを提供せずに GEO メチル化 (450k) データセットを読み込むには?

Gene Expression Omnibus (GEO) からいくつかの Illumina 450k メチル化データセットをダウンロードしました

R Bioconductor パッケージの minfi と ChAMP には、「サンプル シート」と呼ばれるものが必要なようです。

GEO のほとんどの TAR ファイルには、このようなサンプル シートが含まれていないようです。.idat ファイルのみが含まれています。

親切な魂が何かアドバイスをくれるでしょうか?サンプル シートなしで ChAMP / Minfi パイプラインを実行する方法を知りたいです。そうでない場合、.idat ファイルからサンプル シートを生成する方法はありますか?

ありがとう!

0 投票する
1 に答える
34 参照

position - 一部の SNP が間違った位置や染色体に割り当てられているのはなぜですか

ゲノム全体のデータを持ち上げているときに、いくつかの rs 番号がマージされているという問題に遭遇しました。つまり、SNP は一度間違った位置に (または間違った染色体にさえ) 割り当てられたに違いないということです。しばらくして、研究所は間違いに気づき、修正したに違いありません。この場合、古い rs 番号は撤回され、「古い」rs 番号がその SNP に使用されます。わかりました、これまでのところとても良いです。私の質問は、どのような技術的な問題や問題がこのようなずれを引き起こす可能性があるかという質問に関するものです:

SNP が間違った位置 (または染色体) に割り当てられているという技術的な理由はどれですか? それはどうして可能なのですか?

0 投票する
1 に答える
892 参照

r - 特定の範囲内の ap 値を持つバリアントがプロットから除外されるように、マンハッタン プロットの y 軸にブレークを作成する方法は?

変更した qqman 関数を使用してマンハッタン プロットを作成していますが、プロット内のピークの 1 つが非常に高く、しきい値に近い遺伝子座を詳細に確認することはほとんど不可能です。10E-35 と 10E-80 の間の p 値を持つ SNP がプロットから省略されるように、Y 軸を中断したいと思います。plotrix パッケージの gap.plot() 関数を見てきましたが、うまくいかないようです。同じパッケージの axis.break() を使用して、実際のブレーク マークを Y 軸に配置する方法を知っています。

誰かがこの問題に遭遇しましたか?

ありがとう!

0 投票する
1 に答える
1206 参照

python - Pythonのif文の後に変数が0にリセットされる

このエラーが発生しています

IndexError: リスト インデックスが範囲外です

そして、私が集めたものから、ステートメントrに入るとすぐに変数が0にリセットされるためです。if私はPythonを学んでいるので、ヒントやコツがあれば大歓迎です。

これが私のコードです

ps Needleman-Wunchst グローバル アラインメント アルゴリズムを実装しようとしています。

0 投票する
0 に答える
189 参照

r - Rで特定の遺伝子の遺伝子注釈情報(より具体的な機能)を取得するにはどうすればよいですか?

次のような私のesetの行名として遺伝子のリストがあります:

Rでこれらの遺伝子のGO情報(より具体的には機能)を見つけるにはどうすればよいですか?

これが私の解決策でしたが、正しく行っているかどうかはわかりません:

前に述べたように、私が知りたいのはこれらの遺伝子の説明や位置ではなく機能を見つけることですか?

どんな助けでもいただければ幸いです。ありがとう、