問題タブ [fastq]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
linux - グループ キャプチャによる並列 sed
大きなファイルを処理する必要があり、sed、sort などを使用するときに複数のコア プロセッサを使用しようとする並列コマンドについて読んでいます。そのため、最初に 4 行ごとに最初の行を変更したいと考えました (この種のファイルの命名規則 - FastQ 形式のため)。
たとえば、これは 4 つのグループで、最初の行を変更したいと思います。
次のコマンドで、作業を完了しました。
ただし、 parallel を使用すると、グループ キャプチャ ブラケットが認識されないようです。
バックスラッシュを削除するか、 sed -r を使用すると、コマンドは次のように伝えます。
誰かがこれに光を当てることができますか?
どうもありがとうございます
arrays - バッシュ配列が機能しない
私はバイオインフォマティクスにはかなり慣れていませんが、学ぶために最善を尽くしています。私は問題に直面しており、誰かが何をすべきかを知っていて、複数ファイルの bash ツールが実際にどのように機能しているかを説明してくれることを望んでいました。
160個のRNAseqライブラリを解凍したフォルダがあり、name.fastq
. cutadapt
それらすべてで同時に(ライブラリからすべてのアダプターシーケンスを削除するソフトウェア)を実行したい。そのため、1 つのライブラリの場合、コマンドは次のようになります。
それで、私が持っている160個のファイルすべてでそれを実行できるようにbash配列ループを作成しようとしましたが、それでも機能しません。
python - .split() python3 で空白行を作成する
Python3を使用して「fastq」ファイルをタブ区切りファイルに変換しようとしています。入力は次のとおりです(1〜4行目は、タブ区切り形式で印刷する必要がある1つのレコードです)。ここでは、各レコードをリスト オブジェクトに読み込もうとしています。
これを使用して:
出力は次のとおりです。
出力の先頭に空白行が表示されますが、その理由がわかりません?? これは他の多くの方法で実行できることを認識していますが、Python を学習しているため、その理由を理解する必要があります。ありがとう
python - fastq ファイルから fastq ファイルの一意の最初の最初の行と最後の行を見つける
私は2つのファイルを持っています.1つはfasta
ファイルで、もう1つはfastq
ファイルです。fasta
を取得し、各行を読み取り、fastq
ファイル内の各行を検索して、一番上の行と一番下の行を出力したいと考えています。これは私が持っているものです
fasta ファイル
読み取り1
あああああああああああああああああああああああああああああああああああああ
ああああああああああああああああああああああああああああああああああああああ
ああああああああああああああああああああああああああああああああああああああ
あああああああああああああああああああああああああああああああああああああ
あああああああああああああああああああああああああああああああああああああああ
@DH1DQQN1:269:C1UKCACXX:1:1107:20386:6577 1:N:0:TTAGGC
ああああああああああああああああああああああああああああああああああああああ
+
CCCFFFFFHGHHHJIJHFDDDB173@8815BDDB################
@DH1DQQN1:269:C1UKCACXX:1:1114:5718:53821 1:N:0:TTAGGC
あああああああああああああああああああああああああああああああああああああ
+ ;@?DBD<@@FFHHH<
@DH1DQQN1:269:C1UKCACXX:1:1209:10703:35361 1:N:0:TTAGGC
あああああああああああああああああああああああああああああああああああああ
+
@@@FFFFFHGHHHGIJHFDDDDDBDD69@6B-707537BDDDB75@@85
@DH1DQQN1:269:C1UKCACXX:1:1210:18926:75163 1:N:0:TTAGGC
ああああああああああああああああああああああああああああああああああああああ
@CFFFFFFHHHHHJJJHFDDD@77BDDDDB077007@B############
このことから、それが 2 回表示されていることがわかりますがAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA
、印刷したいのは 1 回だけです。どうやってやるの?
最終出力ファイル
@DH1DQQN1:269:C1UKCACXX:1:1107:20386:6577 1:N:0:TTAGGC
ああああああああああああああああああああああああああああああああああああああ
+
CCCFFFFFHGHHHJIJHFDDDB173@8815BDDB################
@DH1DQQN1:269:C1UKCACXX:1:1114:5718:53821 1:N:0:TTAGGC
あああああああああああああああああああああああああああああああああああああ
+
;@?DBD<@@FFHHH<
@DH1DQQN1:269:C1UKCACXX:1:1210:18926:75163 1:N:0:TTAGGC
ああああああああああああああああああああああああああああああああああああああ
+
@CFFFFFFHHHHHJJJHFDD@77BDDDDB077007@B
bash - UNIX でファイルのリストを読み取り、コマンドを実行する
私はシェルスクリプトの初心者で、「for」コマンドの実行方法を理解するのに一日中苦労しています。基本的に、私がやろうとしていることは次のとおりです。
私はたくさんの名前を持つ list.txt ファイルを持っています:
リスト内のすべての名前に対して、2 つの異なるファイルがあり、それぞれ名前の末尾が異なります。元:
実行しようとしているプログラムはsickle
. 基本的に、(互いに対応する) 2 つのファイルを取得し、それらに対して分析を実行するため、この命名規則を使用する必要があります。鎌のコマンドは次のとおりです。
誰かが私を助けてくれれば、少なくとも unix にファイルのリストを読み取らせ、各行を個別に処理させる方法を教えてもらえれば、そこから行くことができると思います。いくつか試してみましたが、どれもうまくいきませんでした。