“fastq”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

955 参照

linux - グループキャプチャによる並列 sed

大きなファイルを処理する必要があり、sed、sort などを使用するときに複数のコアプロセッサを使用しようとする並列コマンドについて読んでいます。そのため、最初に 4 行ごとに最初の行を変更したいと考えました (この種のファイルの命名規則 - FastQ 形式のため)。

たとえば、これは 4 つのグループで、最初の行を変更したいと思います。

次のコマンドで、作業を完了しました。

ただし、 parallel を使用すると、グループキャプチャブラケットが認識されないようです。

バックスラッシュを削除するか、 sed -r を使用すると、コマンドは次のように伝えます。

誰かがこれに光を当てることができますか？

どうもありがとうございます

2013-05-08T09:32:54.630

0 投票する

1 に答える

393 参照

arrays - バッシュ配列が機能しない

私はバイオインフォマティクスにはかなり慣れていませんが、学ぶために最善を尽くしています。私は問題に直面しており、誰かが何をすべきかを知っていて、複数ファイルの bash ツールが実際にどのように機能しているかを説明してくれることを望んでいました。

160個のRNAseqライブラリを解凍したフォルダがあり、name.fastq. cutadaptそれらすべてで同時に（ライブラリからすべてのアダプターシーケンスを削除するソフトウェア）を実行したい。そのため、1 つのライブラリの場合、コマンドは次のようになります。

それで、私が持っている160個のファイルすべてでそれを実行できるようにbash配列ループを作成しようとしましたが、それでも機能しません。

arrays bash fastq

2013-05-31T00:50:00.557

0 投票する

3 に答える

321 参照

python - .split() python3 で空白行を作成する

Python3を使用して「fastq」ファイルをタブ区切りファイルに変換しようとしています。入力は次のとおりです（1〜4行目は、タブ区切り形式で印刷する必要がある1つのレコードです）。ここでは、各レコードをリストオブジェクトに読み込もうとしています。

これを使用して：

出力は次のとおりです。

出力の先頭に空白行が表示されますが、その理由がわかりません?? これは他の多くの方法で実行できることを認識していますが、Python を学習しているため、その理由を理解する必要があります。ありがとう

python blank-line fastq

2013-06-08T19:19:00.250

0 投票する

3 に答える

646 参照

python - fastq ファイルから fastq ファイルの一意の最初の最初の行と最後の行を見つける

私は2つのファイルを持っています.1つはfastaファイルで、もう1つはfastqファイルです。fastaを取得し、各行を読み取り、fastqファイル内の各行を検索して、一番上の行と一番下の行を出力したいと考えています。これは私が持っているものです

fasta ファイル

読み取り1

あああああああああああああああああああああああああああああああああああああ

ああああああああああああああああああああああああああああああああああああああ

ああああああああああああああああああああああああああああああああああああああ

あああああああああああああああああああああああああああああああああああああ

あああああああああああああああああああああああああああああああああああああああ

@DH1DQQN1:269:C1UKCACXX:1:1107:20386:6577 1:N:0:TTAGGC

ああああああああああああああああああああああああああああああああああああああ

+

CCCFFFFFHGHHHJIJHFDDDB173@8815BDDB################

@DH1DQQN1:269:C1UKCACXX:1:1114:5718:53821 1:N:0:TTAGGC

あああああああああああああああああああああああああああああああああああああ

+ ;@?DBD<@@FFHHH<
@DH1DQQN1:269:C1UKCACXX:1:1209:10703:35361 1:N:0:TTAGGC

あああああああああああああああああああああああああああああああああああああ

+

@@@FFFFFHGHHHGIJHFDDDDDBDD69@6B-707537BDDDB75@@85

@DH1DQQN1:269:C1UKCACXX:1:1210:18926:75163 1:N:0:TTAGGC

ああああああああああああああああああああああああああああああああああああああ

@CFFFFFFHHHHHJJJHFDDD@77BDDDDB077007@B############

このことから、それが 2 回表示されていることがわかりますがAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA、印刷したいのは 1 回だけです。どうやってやるの？

最終出力ファイル

@DH1DQQN1:269:C1UKCACXX:1:1107:20386:6577 1:N:0:TTAGGC

ああああああああああああああああああああああああああああああああああああああ

+

CCCFFFFFHGHHHJIJHFDDDB173@8815BDDB################

@DH1DQQN1:269:C1UKCACXX:1:1114:5718:53821 1:N:0:TTAGGC

あああああああああああああああああああああああああああああああああああああ

+

;@?DBD<@@FFHHH<
@DH1DQQN1:269:C1UKCACXX:1:1210:18926:75163 1:N:0:TTAGGC

ああああああああああああああああああああああああああああああああああああああ

+

@CFFFFFFHHHHHJJJHFDD@77BDDDDB077007@B

python unix awk grep fastq

2013-08-02T19:06:49.980

0 投票する

3 に答える

17103 参照

bash - UNIX でファイルのリストを読み取り、コマンドを実行する

私はシェルスクリプトの初心者で、「for」コマンドの実行方法を理解するのに一日中苦労しています。基本的に、私がやろうとしていることは次のとおりです。

私はたくさんの名前を持つ list.txt ファイルを持っています:

リスト内のすべての名前に対して、2 つの異なるファイルがあり、それぞれ名前の末尾が異なります。元：

実行しようとしているプログラムはsickle. 基本的に、(互いに対応する) 2 つのファイルを取得し、それらに対して分析を実行するため、この命名規則を使用する必要があります。鎌のコマンドは次のとおりです。

誰かが私を助けてくれれば、少なくとも unix にファイルのリストを読み取らせ、各行を個別に処理させる方法を教えてもらえれば、そこから行くことができると思います。いくつか試してみましたが、どれもうまくいきませんでした。

bash list loops unix fastq

2013-08-03T02:25:07.647

問題タブ [fastq]

linux - グループ キャプチャによる並列 sed

arrays - バッシュ配列が機能しない

python - .split() python3 で空白行を作成する

python - fastq ファイルから fastq ファイルの一意の最初の最初の行と最後の行を見つける

bash - UNIX でファイルのリストを読み取り、コマンドを実行する

Reference

linux - グループキャプチャによる並列 sed