問題タブ [bioconductor]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - Error inmatrix : Non-numeric matrix Extent
I was trying to run GSA(Gene Set enrichment Analysis) function in R using the Biobase package: Expression Set. I was using the resp.type to be "Two class unpaired" .But when i run the function :
It gives me an error saying :
I dont know what this error means.I did mode(exprs(eset))
,it gives me "numeric"
Can anybody tell me how to get rid of this problem?
r - Protein Databank から Cosmic または Uniprot へのタンパク質配列アラインメント
Cosmic または Uniprot で表示されるタンパク質の正規の AA 配列に、Protein Databank の PDB ファイルを一致させたいと考えています。具体的には、pdb ファイルから、バックボーンの炭素アルファ原子とその xyz 位置を取得する必要があります。また、タンパク質シーケンスで実際の順序を引き出す必要があります。構造 3GFT (Kras - Uniprot Accession Number P01116) の場合、これは簡単です。ResSeq 番号を取得するだけです。ただし、他のいくつかのタンパク質については、これがどのように可能かわかりません.
たとえば、構造 (2ZHQ) (タンパク質 F2 - Uniprot アクセッション番号 P00734) の場合、Seqres は番号「1」と「14」で繰り返される ResSeq 番号を持ち、Icode エントリのみが異なります。さらに、icode エントリは辞書順ではないため、抽出する順序を判断するのは困難です。
構造 3V5Q (Uniprot Accession Number Q16288) を考慮すると、さらに悪化します。ほとんどのタンパク質では、ResSeq 番号は、COSMIC や UNIPROT などのソースからの実際のアミノ酸と一致します。ただし、位置 711 の後、位置 730 にジャンプします。REMARK 465 (欠落している原子) を見ると、チェーン A では 726-729 が欠落していることがわかります。しかし、それをタンパク質と照合した後、それらの AA は実際には 712-715 です。
簡単な 3GFT の例で動作するコードを添付しましたが、誰かが pdb ファイルの専門家であり、残りの部分を理解するのを手伝ってくれるなら、私は大いに感謝します.
r - R Bioconductor インストール エラー - '< DOCTYPE html PUBLI ...' で始まる行の形式が正しくありません
R にバイオコンダクター パッケージをインストールする際に問題があります。トランスクリプトは次のとおりです。
Google で見つけた関連する質問は、インターネット接続エラー (プロキシなど) を示唆していますが、ここではそうではないようです。CRAN からパッケージを問題なくインストールできます: (つまり、install.packages("foreach"))
提案を歓迎します。
r - 引き揃え文字位置
ペアワイズ アラインを使用して、次の結果を取得します。
その後、次を使用できます。
パターンと件名の両方の完全な文字列シーケンスを取得します。しかし、オブジェクトから 448 と 1 を整数として取得するにはどうすればよいでしょうか。これらの数値を使用する必要がありますが、取得する方法がないようです。
r - 「突然変異率」を計算するための任意の R パッケージ
大規模な家族データ (親と子) があります。それらはすべて対立遺伝子の形をしています。すなわち、各遺伝子座および被験者に 2 つの対立遺伝子。私たちの問題は、各遺伝子座での突然変異率/数 (子の対立遺伝子と親の対立遺伝子の間のミスマッチ) を計算することです。それを簡単にできるRパッケージはありますか?
前もって感謝します
r - GenomicFeatures パッケージのインストールに関するトラブル
簡単なインストールの質問ですぐに戻ってきて申し訳ありませんが、自分で解決できないため、生産性が大幅に低下しています。とにかく、BC Web サイトで提案されているように、GenomicFeatures をインストールしてみました。
次のエラー メッセージを受け取りました (いくつかの警告メッセージに加えて)
したがって、依存関係に問題があると思いますが、GFの前に自動的にインストールされるのは奇妙に思えます。バージョン 2.15.0 を使用しています。問題が何であるかについての手がかりはありますか?必要に応じてさらに情報を提供できれば幸いです。ありがとう。
r - R を使用してテーブルをファイルに書き込むと、不要な行名列が生成される
R を使用して、データ列を 1 つのタブ区切りのマトリックスにマージしようとしています。関数を使用するcbind()
と、引数としてそのような列を含めなかったにもかかわらず、R は何らかの理由で行番号を指定する最初の列を追加します。たとえばcbind()
、次の列で使用する場合:
x|y|z
x|y|z
x|y|z
cbind()
yields:
1|x|y|z
2|x|y|z
3|x|y|z
サブセットを使用して最初の列を削除しようとしました私が遭遇した他のいくつかの方法。何をしても、このマトリックスを .txt ファイルに書き込むと、行番号は追加の列として表示されます (したがって、Excel で開くと、Excel によって提供された行番号だけでなく、追加の行も表示されますこのtxtファイルの生成)。それらを Excel で手動で削除することもできますが、生成しようとしているテーブルの量では現実的ではありません。
r - 2 つのファイル間で重複する値を探す
Start、End、および Chromosome 列名をそれぞれ含む 2 つのデータ セットがあります。2 つのファイルの値を比較し、(開始、終了、クロムの位置を考慮して) 重複していない領域があるかどうかを確認し、R を使用してそれらをリストに含めたいと考えています。両方のファイルからデータ ポイントを取得し、それらを比較します
ファイル例 1:
ファイル例 2:
ありがとう
file - 入力ファイルの呼び出しが機能しない
私はバイオコンダクタの Gviz ライブラリを使用しています。染色体表意文字にプロットする必要がある CNV 位置を含むタブ区切りファイルを入力します。
入力ファイルは dat で定義され、4 つの列があります
- [1] 染色体
- [2]スタート
- [3]終了
- [4] 幅 (コピー番号の向きに応じて「+」または「-」になります)
だから私はそれをしました:
ファイル dat を呼び出すと、エラー メッセージが表示されます。
明らかに、入力されたファイルを(datで)呼び出す方法はRを満足させません..誰か助けてください:)
r - IRangesで負の値
BioconductorのGvizライブラリを使用しています。技術的に左から右にグラフ化された表意文字をプロットしようとしていますが、データの幅が負であるため、プロットは右から左に行う必要があります。IRangesで幅に負の値を入力するにはどうすればよいですか?
使用しているコードは次のとおりです。
ありがとう :))))