“qiime”の関連問題_Stack Overflow日本語サイト

0 投票する

0 に答える

154 参照

sequence - BLAST を使用して分類法を trnL 配列に割り当てる方法

私はtrnL葉緑体遺伝子を使用して草食動物の糞から植物を識別しており、現在、イルミナの出力からtrnL配列に分類法を割り当てようとしています。実行したいQIIMEスクリプトとオプションは次のとおりです。

データパイプラインからの入力ファイルと、NCBI GenBank (205,703 シーケンス) からの参照ファイルがあります。しかし、タブ区切りの分類テキストファイルがありません。通常は Excel から生成しますが、FASTA ファイルは非常に大きい (500 MB 以上) ため、Excel で完全に表示することはできず、確実に編集することはできません。

私の質問は、参照 FASTA ファイルから独自のタブ区切りの分類法ファイルを生成するためのコマンドラインメソッドがあるかどうかです。そうでない場合、「assign_taxonomy.py」QIIME スクリプトでこの必須オプションを処理するための他のオプションは何ですか?

2015-09-28T23:19:44.547

0 投票する

1 に答える

166 参照

r - RからのシステムコールでQiimeを呼び出す

ねえ、

QIIMEからのシステムコールで呼び出そうとするとR、つまり

R応答を停止します。ただし、他のコマンドラインプログラムでは問題ありません。

特定のプログラムをR経由で呼び出すことはできませんsystem2()か?

MacQIIME バージョン: MacQIIME 1.8.0-20140103

MacQIIME 環境変数を取得しています...

これは、デフォルトの python が DIFFERENT (/macqiime/bin/python) であり、PATH に他の新しい QIIME 関連のものがあることを除いて、通常の端末シェルと同じです。

(私は主にwhichQIIMEを呼び出すことにも関心があることに注意してください。ただし、問題が関連していると強く思います)R Markdownengine = "sh"

r r-markdown qiime

2015-11-28T16:13:29.063

0 投票する

0 に答える

464 参照

r - 2 つの行列間の対になったサンプル間の cor を使用して、スピアマン相関 Rho を計算します。

2 つの OTU テーブル (基本的に存在量マトリックス) に基づいて、cor.test を実行しようとすると問題が発生します。

8 つの異なるサンプリングスポット (列 1 から 44) を含むテーブルがあり、各サンプリングスポットについて、変数 (VARIABLE1、最初の行) と一連の種の存在 (行の OTU) を測定しました。以下に、これらの OTU テーブルがどのように見えるかの例を示します。

サンプル 1 ～ 8 は列です

これらのテーブルを 2 つ .biom 形式で持っています。対になったサンプル間のスピアマンの相関係数 (R) を計算したい (例: sample1(OTU テーブル 1) 対 sample1(OTU テーブル 2); sample2(OTU テーブル 1) 対 sample2(OTU テーブル 2) など)各OTU用。約 100 のサンプルと 4000 OTU の豊富なデータがあります。したがって、4000 OTU ごとに 44 ペアのデータの相関係数を計算したいと思います。したがって、基本的には、サンプルごとに 1 回 ~4k の長さのベクトルを相関させるだけです。

最後に、各サンプルの 4k の長さのベクトルの相関の平均を取り、これらの平均を散布図にプロットします。

私の豊富なデータはすべてこの .biom 形式であることを覚えておいてください! 操作しやすいように、すべてを .txt に変換しました。

再度、感謝します！！

これがどのように見えるかの例は次のとおりです。

サンプルデータは次のとおりです。

OTU テーブル 1: https://1drv.ms/u/s!Ah_Q0DzXKdX-gZUl8SCetQdYE8S3CA

OTU テーブル 2: https://1drv.ms/u/s!Ah_Q0DzXKdX-gZUnaIwEIJiYMnrQIA

r matrix bioinformatics correlation qiime

2016-08-15T18:26:27.093

0 投票する

0 に答える

185 参照

r - 非常に大きな OTU (存在量) テーブルをワイド形式からロング形式に再形成 - 400,000 観測

非常に大きな OTU (豊富な) テーブルがあります。100 を超えるサンプルと、サンプルあたり 4000 の観測値 (4000 分類群) があります。

OTU テーブルの例を次に示します。

このテーブルを長い形式で取得したいので、別のテーブルのサンプル間でペアごとのテストを実行できます。カウントデータのみに関心がありますが、サンプルが 2 つに属し、それぞれの OTU に属している場合は、それを取得しますが、必須ではありません。データは次のようになります。

私のスクリプトは動作しているように見えますが、まだ実行されている NO id variable エラーメッセージが表示されます。誰かがそれを修正する方法を知っているなら、私はそれを大いに感謝します.

助けてください！

r reshape reshape2 tidyr qiime

2016-08-17T21:06:01.687

0 投票する

1 に答える

31 参照

perl - perlでリストの冗長をなくす

こんにちは、このスクリプトを作成して、silva データベースを使用して qiime から取得した OTU ファイルからすべての門を抽出しました。サブルーチンを追加して、重複する分類群を排除し、すべての冗長 (各分類群の 1 つ) を抽出しました。私の問題は、las 行を取得することです。 (1 つの分類群のみ)

perl bioinformatics redundancy qiime

2016-10-26T17:37:56.977

0 投票する

1 に答える

79 参照

perl - 2 つ以上のオプションと一致する perl

qiime 分析から取得した 2 つの形式があります。1 つは silva データベースから取得し、もう 1 つは GreenGenes から取得しました。これらのファイルの違いは、silva ファイルには分類群ごとにプログレッシブ D_number (kingdom= D_0__、phylum= D_1__、clase= D_2__ など) があり、GreenGenes ファイルには各分類群に文字 (kingdom= K__、phylum= p__) があることです。、clase= c__ など)

そこで、Perl で 2 つのスクリプト (Silva 用と GreenGenes 用) を作成し、各分類群を個別のファイルに抽出しました。

両方の形式の一致セクションにコードを組み込もうとしています。つまり:

16 行目では、次のような 2 つのオプションが必要です。

まあ、それがうまくいかないことはわかっています

では、正規表現の一致のために同じ行に2つ以上のオプションを追加するにはどうすればよいですか??

これはスクリプトの一部です (オプションは 6 つあり、Kingdom オプションを記述しただけです !!):

ありがとう

perl bioinformatics qiime

2016-10-27T20:45:57.773

問題タブ [qiime]

sequence - BLAST を使用して分類法を trnL 配列に割り当てる方法

r - RからのシステムコールでQiimeを呼び出す

r - 2 つの行列間の対になったサンプル間の cor を使用して、スピアマン相関 Rho を計算します。

r - 非常に大きな OTU (存在量) テーブルをワイド形式からロング形式に再形成 - 400,000 観測

perl - perlでリストの冗長をなくす

perl - 2 つ以上のオプションと一致する perl

Reference