問題タブ [bioinformatics]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
web-services - curlを使用してSOAPクエリをreactome.orgに送信する
(注:この質問はBiostarにクロスポストされました)
こんにちは、みんな、
curlを使用して、RPCでエンコードされたSOAPクエリをReactome(生物学的経路データベース)に送信しようとしています。
http://www.reactome.org:8080/caBIOWebApp/services/caBIOService?wsdlで定義されているリモートメソッドqueryPathwaysForReferenceIdentifiersを呼び出したい
次のSOAP/XMLファイルを作成しました:soap.xml
次のコマンドを使用してcurlで送信しました。
しかし、応答は空ですが、私は結果を期待していました。
リクエストにエラーがありますか?どこ ?
どうもありがとう !
ピエール
matlab - Matlab: プロットの列の高さが均一な seqlogo
Matlabで、アミノ酸配列プロファイルのseqlogo プロットを作成したいと考えています。しかし、プロット列の高さをエントロピーでスケーリングする代わりに、すべての列を同じ高さにしたいのです。
この質問への回答からコードを変更中ですが、列の高さを均一にするために見逃したseqlogoまたはその他の関数へのパラメーターがあるかどうか疑問に思います。
または、シーケンスプロファイルに適用して目的の出力をハックできる統計的変換はありますか? (列の高さは均一で、各文字の高さは seqprofile の確率に比例します)
perl - STDIN から読み取るのではなく、ファイルから読み取るには何を変更する必要がありますか?
このプログラムは、ヌクレオチド配列を取り、それをタンパク質配列に翻訳するように書かれています。しかし、プログラムはファイルからすべてのヌクレオチド配列を取得し、タンパク質配列に変換する必要があります。ヌクレオチド配列を含むファイルは次のようになります。
プログラムは 1 行で入力を受け取ります。プログラムは、複数行のシーケンスから構成されるファイルを読み取る必要があります。たとえば、複数のシーケンスがあり、すべてのシーケンス>
が 1 つのファイルで始まります。問題は、プログラムが入力を 1 行で受け取ることです。
プログラムは次のとおりです。
normalization - 分散分析の前にスケーリングしますか?
発現差のある遺伝子を同定するための分散分析を行いたい。差次的に発現する遺伝子を探す前に、分位正規化または中央絶対偏差を使用してデータをスケーリングする必要がありますか、それともRMAを介して取得したデータに直接分散分析を適用する必要がありますか?
よろしくお願いします
java - 遺伝的プロセスはJavaで役立ちます
Java プロジェクトに関するガイダンスが必要です。私は、ヒトの遺伝(家系)系統樹を開発する予定です。
これは主題です:
人間の各細胞には、1 番から 22 番までの番号が付けられた 23 対の染色体と、1 組の性染色体 (女性の XX と男性の XY) が含まれています。受精の間に、男性の 22 + (X または Y) 染色体は、女性の 22 + X 染色体と結合します。これにより、将来の赤ちゃんを形成する細胞内に 22 対の染色体 + (X または Y) が生じます。父親から受け継がれた23番目の染色体(XまたはY)によって、子供の性別が決まります(女の子はXX、男の子はXY)。
各染色体は多くの遺伝子を持っています (特徴的な形態学的、生理学的、行動的であるほとんどすべてをコードしています)。染色体のペアにより、遺伝情報が複製されます (性染色体の一部を除く)。遺伝子の各コピーは対立遺伝子と呼ばれます。つまり、たとえば、a 遺伝子が目の色の原因である場合、対立遺伝子は青色になります。
存在する対立遺伝子の複合発現の結果として発現される遺伝情報。優性対立遺伝子は、常にその担い手のゲノムで発現されます。しかし、同じ遺伝子の優性対立遺伝子が存在するときに、一方の対立遺伝子からの情報が表現されない場合、それは劣性対立遺伝子です。遺伝子の劣性対立遺伝子の特異性は、それがゲノムに存在し、その担い手の表現型で発現されることなく数世代にわたって伝達されることです。優性対立遺伝子がなく、遺伝子の 2 つのコピーが同じ劣性対立遺伝子 (ホモ接合型劣性) を持っている場合、劣性形質が発現します。ファミリーツリーを使用することにより、ファミリー内の遺伝子の発現を決定することができます。
プログラムは、次のことができる必要があります。
- 23 の染色体に依存する単純化されたバージョンを生成し、ユーザーが遺伝子を染色体に配置してから、染色体の複製、有糸分裂、減数分裂、および融合をシミュレートし、結果の細胞に遺伝子の位置を表示できるようにします。
- 人の家系図上の遺伝子の発現に関する家系図と推定確率 (または確実性) を描画できるようにします。
これまでのところ、クラス Gene とクラス Chromosome を作成しました。次に、たとえば「Parent」というクラスを作成し、その中に 23 個の染色体を作成することを考えました。しかし、それを行う前に、23 番目の染色体を男性と女性で異なるものにしたいと考えています。次に、複製、交差、有糸分裂などをシミュレートします。正しい軌道に乗っているかどうかはわかりません。また、特定の対立遺伝子/遺伝子が劣性または優性であることを指定する方法もわかりません。現時点では、私のクラスはランダムな方法でのみ動作します。
Gene.java
染色体.java
ありがとう
perl - ファイルを入力として受け取り、改行文字を無視する方法
以下は、fasta fileA の内容です。
ここで、入力として fileA を取得し、1 と 2、次に 1-3 の間に存在するミスマッチを見つけ、それらの間のヌクレオチドの変化も見つける必要があります。これまでにプログラムを作成しましたが、fileA を入力として取りません。親切に助けて
私の問題は、ファイルAを入力として指定する必要があり、シーケンスには51ヌクレオチドごとに改行文字が含まれており、プログラムはミスマッチを見つけるために改行文字も考慮します。
プログラム:
scala - バイオインフォマティクス/生物統計学/医学研究のための Clojure または Scala
私はプロのプログラマーではありません (私の分野は医学研究です) が、C/C++ およびさまざまなスクリプト言語はかなりの能力があります。しばらく前に Lisp に興味を持ちましたが、真剣に学ぶ時間がありませんでした。Rに少し触れた後、関数型プログラミング言語により多くの時間を投資することにしました。
JVM 言語の実用性が欲しいので、Clojure と Scala に絞り込みました。私が理解していることから、どちらも既存の Java ライブラリを使用でき、パフォーマンスが重要なコードを Java に委譲することができ、比較的同等にうまく機能する可能性があります。
これらの言語は、私が必要とするアプリケーション空間でどのように比較されますか? どちらかを使用したバイオインフォマティクスの実際のプロジェクトはありますか?
優れたドキュメントとかなり穏やかな学習曲線と同様に、既存のコードは深刻なプラスになります。また、両者の同時実行モデルはどのように比較されますか?
誰もが持っている重要な利点/欠点はありますか?
perl - 基本的な質問を機械化する
私はこのウェブサイトで作業しています: http://bioinfo.uni-plovdiv.bg/microinspector/
そして、メカダンプから、私は得る
これは私がこれまでに持っているものです。
次に何をすべきかわかりません。有機体を正しく設定していないように感じます (ドロップダウン メニューなので選択する必要があります) が、コードに正しく記述しているとは思いません。
さらに、フォームがクリックされると、新しいページに移動します (url は POST?)。どんな助けでも大歓迎です。ありがとうございました。上記のコードを実行すると、これが得られます
入力されているシーケンスは、試してみたい人のためにこれです
AAACACACTGGGGAATGGAGCAAGACAGTCTTTGAATATCAAACACGCAAGGCAATGAGACTACCCATCATAGATATCGCACCCTATGACATTGGGGGTCCTGATCAAGAATTTGGTGTGGACATTGGCCCTGTTTGCTTTTTATAAGCCAAACTCTCTGAAACCCCAGCAAAACAAAAACCACATCCATGTGTTCATCTTGTTTTAATCTTATCAACCAGTGCAAGTGACCAACTAAATTCCAGTTATTTATTTCCAAACTTTTGGAAAAAGCATAATTTGACAAAAAAAGAATACAATTTTTTGCTGTTTCAACCACCCAATACAGGTCAAATGCTTTTGTTTTATTTTTTTACCAATTCCAACTTCAAAATGTCTCAATGGTGCTATAATAAATAAACGTCAACACTTTTATGATAA
histogram - 変動分析のアルゴリズム
私はたくさんのヒストグラムを扱っています。特に、これらのヒストグラムは、ヒトゲノム上のセグメントに沿ったベースコールのものです。
x軸に沿った各ポイントは、DNAを構成する4つの窒素塩基(A、C、T、G)の1つであり、y軸は、塩基が「呼び出された」(またはシーケンサーによって認識された)回数を表します。機械、ゲノムを配列決定するために、それは単にゲノムに沿った各塩基の同一性を決定している)。
これらのヒストグラムの多くは、プラトーのような領域から0または(ほぼ0)に低下するほぼ線形のドロップオフ(マシンが十分な読み取り深度を取得できない場合)を表示します。スコアがゼロに下がると、シーケンサーがベースのIDを判別できないことを意味します。以前に二重らせんを見たことがある場合は、シーケンサーがらせんのラングの半分の識別を理解できないことを意味します。ゲノムの特定の領域は、他の領域よりも特徴づけるのが困難です。100以上のオーダーのベースコールの数が多いベース(またはxデータポイント)は、明確に識別できます。たとえば、1つのベースに対して合計250の呼び出しがあり、248のTが呼び出され、1つのGが呼び出され、1つのAが呼び出された場合、Tと呼びます。近隣の地域から、低読み取り地域のアイデンティティが何であるかを推測する必要があります。これらのプロットにこの傾向を反映するスコアを割り当てるための簡単なアルゴリズムはありますか?組織の例については、box.net / shared/nbygq2x03uを参照してください。
perl - submit()に関する質問を機械化する
フォーラムを見回して答えを探してみましたが、わかりません。計算に時間がかかるWebページのフォームを送信した後、Mechanizeはすべての計算が完了するのを待ちます(1時間かかる場合でも)。それは起こらないようです。Mechanizeオブジェクトを作成し、フォームを送信し、計算が完了した後に出力ファイルをダウンロードするサブルーチンを繰り返し処理しています。ただし、計算に時間がかかる場合があるため、これらのタスクをすべて完了せずに、ループの次の反復にジャンプするように感じます。誰か提案はありますか?ありがとう。これはサブルーチンです