問題タブ [bioconductor]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
3554 参照

r - .tar.gz ではないローカル パッケージのインストール

(BioConductor の pdInfoBuilder を使用して) 現在のディレクトリにパッケージを作成するスクリプトに取り組んでおり、スクリプトの実行中にインストールしたいと考えています。install.packages()with repo=NULL は明らかな選択のように思えますが、これは tarball および gzip されたパッケージ ディレクトリを除いてのみのようです。create.pkg()関数は *.tar.gz を作成しないため、これをオーバーライドする方法はありますか? 現在私は使用しています:

ありがとう、ヴィンス

0 投票する
2 に答える
265 参照

r - R 統計パッケージ: GOFrame オブジェクトのラッピング

サポートされていない生物の R で遺伝子オントロジー マッピングを生成するために GOFrame オブジェクトを生成しようとしています ( http://www.bioconductor.org/packages/release/bioc/vignettes/GOstats/inst/doc/GOstatsForUnsupportedOrganisms.pdfを参照)。

ただし、文字通り指示に従っても役に立ちません。これが私が実行するコードです(ubuntu koala 64ビットのR 2.9.2)

ただし、データフレームを goFrame オブジェクトにマップしようとすると、この間違いが発生します

GOFrame ラッパーが AnnotationDBI ライブラリにあると確信しているので、困惑しています。どんな助けでも大歓迎です:-)

0 投票する
4 に答える
2467 参照

bioinformatics - multiFASTAファイル処理

multiFASTAファイルを処理して、配列の数、長さ、ヌクレオチド/アミノ酸の含有量などの情報を取得し、説明的なプロットを自動的に描画できるバイオインフォマティクスツールがあるかどうか知りたいと思いました。R BIoconductorソリューションまたはBioPerlモジュールでもかまいませんが、何も見つかりませんでした。

手伝って頂けますか?どうもありがとう :-)

0 投票する
3 に答える
1930 参照

r - RエラーallocMatrix

こんにちは、みんな、

標準のBioConductorコマンド(64ビットLinuxのR 2.8.1、72 GBのRAM)を使用して、一定量のAffymetrixCELファイルを読み込もうとしていました。

しかし、私はこのメッセージを受け取り続けます:

このallocMatrixエラーの一般的な意味は何ですか?最大サイズを大きくする方法はありますか?

ありがとうございました

0 投票する
3 に答える
224 参照

r - Rでは、別のオブジェクトのクラスに基づいてS4クラスを設定するにはどうすればよいですか

Bioconductor の ShortRead ライブラリから ShortReadQ タイプのオブジェクトを作成する必要があります。

品質スロットは、エミュレートしたい別の ShortReadQ オブジェクトから簡単に判断できる QualityScore から継承するオブジェクトである必要があります。

コンストラクター引数でその情報 (「SFastqQuality」) を使用する最良の方法は何ですか?

0 投票する
2 に答える
5517 参照

python - rpy2: data.frame を numpy 配列に変換する

R に data.frame があります。多くの (125) 配列からの遺伝子発現レベルなど、多くのデータが含まれています。主に R での私の無能さと、これが 30 分の仕事になるはずだったという事実のために、私は Python のデータが欲しいです。

次のコードを機能させたいと思います。このコードを理解するには、変数pathにデータ セットへのフル パスが含まれていることを知っておいてください。このデータ セットをロードすると、 という変数が得られますimmgenimmgenそれがオブジェクト (BioconductorExpressionSetオブジェクト) であり、exprs(immgen)125 列 (実験) と数万行 (名前付き遺伝子) のデータ フレームを返すことを知っています。(念のため、これは Python コードで、robjects.r を使用して R コードを呼び出します)

このコードは実行されますが、expression_data単にarray([[1]]).

次のような理由により、e生成されたデータフレームを表していないと確信しています。exprs()

しかし、もう一度誰が知っていますか?e私のdata.frameを表していたとしても、それが配列に直接変換されないことは十分に公平です-データフレームには配列(行名と列名)よりも多くのものが含まれているため、人生はこれほど簡単ではないはずです. ただし、変換を実行する方法はまだわかりません。ドキュメントは私には少し簡潔すぎますが、ドキュメントの見出しの理解が限られているため、これが可能であることを示唆しています。

誰でも何か考えはありますか?

0 投票する
2 に答える
1558 参照

r - R + Bioconductor : ExpressionSet でプローブセットを組み合わせる

まず、これはこの質問に対して間違ったフォーラムである可能性があります。これは R+Bioconductor 固有のものです。ここに私が持っているものがあります:

現在、cd4T は、19794 行 (プローブセット) と 15 列 (サンプル) の大きな行列をラップする ExpressionSet オブジェクトです。最後の行は、対応する遺伝子シンボルを持たないすべてのプローブセットを取り除きます。問題は、このセットのほとんどの遺伝子が複数のプローブセットに割り当てられていることです。あなたはこれを見ることができます

したがって、私の 19794 個のプローブセットのうち 6897 個だけが固有のプローブセット -> 遺伝子マッピングを持っています。各遺伝子に関連する各プローブセットの発現レベルをどうにかして組み合わせたいと思います。各プローブの実際のプローブ ID はあまり気にしません。私のダウンストリーム分析はすべてこのクラスで動作するように設計されているため、マージされた情報を含む ExpressionSet を最終的に作成したいと考えています。

これを手動で行うコードを書き、新しい式セットをゼロから作成できると思います。しかし、これは新しい問題ではなく、遺伝子発現レベルを組み合わせるための統計的に正しい方法を使用して、それを実行するためのコードが存在すると思います。これにも適切な名前があると思いますが、私のグーグルはあまり役に立ちません。誰でも助けることができますか?

0 投票する
1 に答える
3573 参照

r - R の CMA Bioconductor パッケージを使用する場合の SVM 分類の交差検証での「モデルが空」エラーの解決

Bioconductor パッケージCMAを使用して、マイクロ アレイ データセットの SVM 分類器で内部のモンテカルロ交差検証 (MCCV) を実行しています。CMA は、SVM 作業に e1071 R パッケージを内部的に使用します。

データセットには、2 つのクラス (ラベル 0 または 1、約 1:1 の比率) のいずれかに属する 45 のサンプル (観察) に対する 387 の変数 (属性) があります。すべてのデータは数値であり、NA はありません。差次的遺伝子発現解析のリマ統計を使用して、SVM 用に選択された 15 の変数で 1000 反復 MCCV を試みています。MCCV では、45 サンプル セットの一部が SVM 分類器のトレーニングに使用され、残りの部分をテストするために使用されます。トレーニング セットの部分にさまざまな値を試しています。CMA は、内部ループ検証 (デフォルトでは、トレーニング セット内の 3 分割交差検証) も実行して、テスト セットに対する交差検証に使用される分類子を微調整します。これはすべて、CMA パッケージ内から実行されます。

トレーニング セットのサイズが小さい場合、CMA はコンソールにエラーを表示し、残りの分類コードの実行を停止します。

変数の選択に limma 以外のテストを使用したり、分類器の生成に 15 個ではなく 2 個の変数を使用したりした場合でも発生します。私が使用する R コードでは、トレーニング セットが常に両方のクラスのメンバーを持つようにする必要があります。これについての洞察をいただければ幸いです。

以下は、Mac OS X 10.6.6、R 2.12.1、Biobase 2.10.0、CMA 1.8.1、limma 3.6.9、および WilcoxCV 1.0.2 で使用する R コードです。データ ファイル hy3ExpHsaMir.txt は、 http: //rapidshare.com/files/447062901/hy3ExpHsaMir.txt からダウンロードできます。

for(g in 0:10)ループでgが 9 になるまで、すべて問題ありません(トレーニング/テスト セットのサイズを変更するため)。

traceback() の出力:

0 投票する
1 に答える
7607 参照

r - R を使用する優れた Limma チュートリアルが必要です

R が不足している limma パッケージで統計分析を使い始めようとしています。良いチュートリアルを知っている人はいますか?

0 投票する
1 に答える
1390 参照

r - パッケージ Limma -コントラスト マトリックス微分表現

私は limma を使用して遺伝子発現差を解析しています。モデリングには、デザインとコントラスト マトリックスが必要です。誰かがそれを経験したかどうか知りたいだけです。

発現が野生型 (WT) と変異体 (M) からのものであり、これらは刺激された (S) または刺激されていない (you) のいずれかであるとします。野生型の場合は 40 個の式の値があり、突然変異体の場合は 20 個あります。

したがって、どの遺伝子が野生型と比較して変異体で異なる反応をするかを知りたい場合、どの式を対比マトリックスに使用すればよいでしょうか: