問題タブ [protein-database]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c++ - シンプルな PDB ライブラリ
pdb ファイルから原子座標を抽出するための単純な C++ ライブラリを探しています。私が遭遇したほとんどのものは、私の単純なニーズに対してあまりにも多くのことを行い、それらを不必要に複雑にしています.
database - 生物学的配列の保存に長けた商用データベース
タンパク質/DNA配列のような生物学的配列の保存に長けている商用データベースはどれですか?そのようなシーケンスを保存するために特別に設計されたものはありますか?
乾杯
c++ - タンパク質のリボン図をレンダリングする OpenGL コード
OpenGL と C++ を使用して、タンパク質のリボン図をレンダリングしようとしています。このためのオープンソースコードが既に存在するかどうか、またはこれを行うための優れたガイドがあるかどうかは誰にもわかりませんか? そうでない場合は、自分で解決したいと思います ;) しかし、特に車輪が無料である場合は、車輪を再発明したくありませんでした。
編集:回答ありがとうございます。これらのプログラムのいずれかが、タンパク質内の原子の構造に基づいてレンダリングするために特定の頂点または三角形メッシュを保存する理由の背後にある理由についての適切なドキュメントを持っているかどうか知っていますか?
perl - DNAからRNAへの変換とPerlによるタンパク質の取得
私は、DNAを読み取ってそのRNAを見つけるプロジェクト(Perlで実装する必要がありますが、得意ではありません)に取り組んでいます。そのRNAをトリプレットに分割して、同等のタンパク質名を取得します。手順を説明します。
1)次のDNAをRNAに転写し、遺伝暗号を使用してアミノ酸の配列に翻訳します
例:
2)DNAを転写するには、最初に各DNAを対応するものに置き換えます(つまり、CをG、GをC、AをT、TをA)。
次に、チミン(T)ベースがウラシル(U)になることを思い出してください。したがって、シーケンスは次のようになります。
遺伝暗号の使用はそのようなものです
次に、各トリプレット(コドン)を遺伝暗号表で調べます。したがって、AGUはSerとして記述できるSerineになるか、S。AUUはIとして記述されるIsoleucine(Ile)になります。このように続けると、次のようになります。
タンパク質の表を示します。
では、どうすればそのコードをPerlで書くことができますか?質問を編集して、自分が行ったことのコードを記述します。
python - タンパク質構造の可視化
私は、ユーザーが pdb ファイルを開いてタンパク質構造を取得する RasMol のような、タンパク質構造の視覚化に関する作業を依頼されました。
pdb ファイルからタンパク質構造を生成するにはどうすればよいですか?
Python でコーディングし、構造を視覚化するには、OpenGL または VTK を使用する必要がありますか? この点で私を助けるかもしれない他のモジュールはありますか?
python - モデラー スクリプト build_profile.py で正しい出力が得られない
タンパク質構造モデリング用の9、python2.3で実行する方法により、以前にインストールを行いました。スクリプトを実行すると、出力は正しくありません。すべてのタンパク質配列の整列である必要があり、最初の配列のみを取得し、何も取得しませんそれ以外の場合、正しい出力を得るために私がすべきことこれはスクリプトです
そして出力は
出力は次のようになります
protein-database - pdb プロテインバンクフォーマット - リガンド除去
PDB レコードからさまざまなリガンドを削除したいと考えています。HET、HETNAM、HETATM を削除するだけで十分ですか? 化合物は 3 文字のコードで識別されますか、それとも他のフィールドを消去する必要がありますか?
この目的のために既に書かれた python|perl スクリプトはありますか?
protein-database - 複数のアラインされた配列の類似性パーセンテージを見つける方法
私の質問はタンパク質配列アラインメントに関連しています。alignmnetにClustalWを使用すると、同一性のパーセンテージが非常に類似しており、毎週類似していることがわかります。しかし、Identityではなくすべての整列された配列の類似性のパーセンテージを見つけたいと思います。
私はそれを解決するためのアルゴリズムを見つけるのに役立つソフトウェアを探しましたが、それらをダウンロードできませんex:MStatXこれは私の問題を解決するために有望に聞こえますが、どういうわけかそれをダウンロードするための情報を見つけることができません。
シーケンスの類似性のパーセンテージを計算するための1つのソリューションのように見える類似性マトリックスについても読みました。それでも、ソフトウェアがあればダウンロードするための情報がどこにあるのかわかりません。
複数の整列されたシーケンスの類似性パーセンテージを計算するための適切なツールまたは方法を見つけるのを手伝ってくれる人はいますか?
ありがとう、パヴィスラ。
matlab - MSタンパク質分析のためにMatlabで次の関数をどのように書くことができますか?
あなたの助けが必要です。私はfastaファイル形式で40000以上のタンパク質を持っています。
まず、関数を書きたいと思います。
- これは、bイオンとyイオンの質量を計算することができます
- ターゲットタンパク質からペプチドデータベースを作成します(mat-file)
- おとりタンパク質からのペプチドデータベースを作成します(mat-file)
次に、私はしたい:
- 観測データをロードする
- 特定のppm精度を指定して、候補ペプチドのペプチドデータベースをフィルタリングします
- 観察されたデータに対して候補ペプチドをスコアリングする関数を記述します
- 偽物からボナフィドペプチドスペクトルの一致を識別するためのしきい値処理スキームを考え出す
r - Protein Databank から Cosmic または Uniprot へのタンパク質配列アラインメント
Cosmic または Uniprot で表示されるタンパク質の正規の AA 配列に、Protein Databank の PDB ファイルを一致させたいと考えています。具体的には、pdb ファイルから、バックボーンの炭素アルファ原子とその xyz 位置を取得する必要があります。また、タンパク質シーケンスで実際の順序を引き出す必要があります。構造 3GFT (Kras - Uniprot Accession Number P01116) の場合、これは簡単です。ResSeq 番号を取得するだけです。ただし、他のいくつかのタンパク質については、これがどのように可能かわかりません.
たとえば、構造 (2ZHQ) (タンパク質 F2 - Uniprot アクセッション番号 P00734) の場合、Seqres は番号「1」と「14」で繰り返される ResSeq 番号を持ち、Icode エントリのみが異なります。さらに、icode エントリは辞書順ではないため、抽出する順序を判断するのは困難です。
構造 3V5Q (Uniprot Accession Number Q16288) を考慮すると、さらに悪化します。ほとんどのタンパク質では、ResSeq 番号は、COSMIC や UNIPROT などのソースからの実際のアミノ酸と一致します。ただし、位置 711 の後、位置 730 にジャンプします。REMARK 465 (欠落している原子) を見ると、チェーン A では 726-729 が欠落していることがわかります。しかし、それをタンパク質と照合した後、それらの AA は実際には 712-715 です。
簡単な 3GFT の例で動作するコードを添付しましたが、誰かが pdb ファイルの専門家であり、残りの部分を理解するのを手伝ってくれるなら、私は大いに感謝します.