問題タブ [dna-sequence]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
3 に答える
519 参照

python - 3 の倍数のグループで文字列を辞書と比較する

多数の DNA 文字 (常に 3 で割り切れる) を読み取り、それらが同じアミノ酸に対応するかどうかをチェックするプログラムを作成しています。たとえば、AAT と AAC は両方とも N に対応するため、プログラムは「同じです」と出力する必要があります。これは問題ありませんが、6/9/12/任意の 3 の倍数を比較して、定義が同じかどうかを確認する方法がわかりません。例えば:

私を返してください 二人ともKNKだから同じです。

これは私のコードです:

そして、私の codon_amino.txt の構造は次のようになっています。

3 つのパターンで DNA 構造を比較するにはどうすればよいですか? 3文字の長さの文字列に対しては機能していますが、それ以上の文字列に対してはエラーが返されます。

編集:

a と b を 3 間隔のリストに分割する方法を知っていれば、次のように役立つかもしれません。

次に、for ループを使用してそれらを反復処理するのは簡単ですが、そもそもそれらを分割するにはどうすればよいでしょうか?

編集:解決策:

0 投票する
1 に答える
3002 参照

java - Javaで指定された最大ハミング距離(不一致の数)によってすべての文字列の組み合わせを取得する

文字列 (DNA シーケンス) のすべての可能な文字列の組み合わせを生成するアルゴリズムはありますか (最大のミスマッチ、最大のハミング距離)。

アルファベットは{A,C,T,G}です。

文字列AGCCと Mismatches の最大数の例2:

考えられるアプローチの 1 つは、特定の文字列のすべての順列を含むセットを生成し、それらを反復処理して、ハミング距離が本来よりも大きいすべての文字列を削除することです。

このアプローチは、指定された 20 文字の文字列と最大ハミング距離 5 によって、非常にリソースを消費します。

そのための別のより効率的なアプローチ/実装はありますか?

0 投票する
4 に答える
2229 参照

string - 文字列Rで文字列が出現する回数を数える必要がある

つまり、ヌクレオチドのシーケンスがあり、そのシーケンスに gaga という単語が出現する回数を数える必要があります。これは私がこれまでに持っているものです:

出力例を次に示します。

最終的には、これを 100 回実行するループを作成し、「gaga」という単語のカウントのヒストグラムをプロットします。そこで、私の主な質問は、文字列 x2 を検索して "gaga" という単語の出現回数をカウントする関数またはコードをどのように記述すればよいかということです。

どんな助けでも大歓迎です!ありがとうございました!

0 投票する
5 に答える
11608 参照

python - 逆補体 DNA

PythonでDNAを逆補完するための次の式があります。

ただし、次の行:

互いに等しくない。一番上の行だけが答えを与えます。一番下には「NONE」と表示されます

これはなぜですか?

0 投票する
2 に答える
70 参照

python - このコードの何が問題なのかを理解してくれる人はいますか? 同一 RNA シーケンス マッチング プログラム

ユーザーに 2 つのシーケンスを要求する際にエラーが発生したようです。

0 投票する
1 に答える
4916 参照

python-2.7 - Python: ネストされた for ループ - 名前が定義されていません

まず第一に、私はプログラマーではないことを指摘しなければなりません。したがって、これはおそらくばかげた質問ですが、ここで何が起こっているのかを理解したいと思います。

プログラムは文字列 (ゲノム) を通過し、任意の長さのウィンドウ (この場合は 'l') をスライドする必要があります。指定された長さ (k) の文字の繰り返しシーケンスを検索し、シーケンスの出現回数を記録します。文字列全体で繰り返しシーケンスを見つけることができましたが、上記のウィンドウが私を悩ませています。ネストされたループを使用してみました:

「NameError: 名前 'c' が定義されていません」というエラーが表示されます。この問題の原因は何ですか。わかりやすい修正方法はありますか? 効率はそれほど重要ではないので、同様の構造を維持したいと思います (ネストされた for ループの使用を回避する方法を説明する多くのトピックを見つけましたが、現在はかなり混乱しています)。

前もって感謝します。

0 投票する
1 に答える
120 参照

search - ターゲット配列に一致しない配列を見つける

BiostarのRnaerによる興味深い質問:

線虫ゲノムのどの領域とも一致しない特定の長さ (たとえば 30nt) の固有の DNA/タンパク質配列を見つけたいと考えています。それを行うためのツールはありますか?

0 投票する
0 に答える
306 参照

java - JSP Struct Web ページで DNA 配列を視覚化する

以下のようにビジュアライザを爆発させるために、DNA配列アライメントをよりスリムに視覚化する必要があります>私たちのプロジェクトは、JSP、Structを備えたJavaバックエンドを持つWebベースのプロジェクトです

http://eagle.fish.washington.edu/Arabidopsis/20110721%20PGS2%20BLAST%20Alignment.pngを視覚化するために現在必要な方法

動的コンテンツの視覚化に HTML テーブルを使用することはできません。アライメント情報は既に生成されており、jQuery や flash プラグインを使用しても画像をよりスリムに視覚化する方法を知る必要があります。