問題タブ [fastq]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
bash - ディレクトリ名と一致するようにファイル名を動的に割り当てる
ここでは、ディレクトリ「source」に約 30 のサブディレクトリがあります。各サブディレクトリには、特定の .fastq.gz ファイルがあり、それらを 1 つの .fastq.gz ファイルにマージし、マージしたファイルを宛先ディレクトリに保存します。ご覧のとおり、プログラムでファイルを動的に作成しています。それらの名前を、fastq ファイルが存在するディレクトリ名 (基本的に $f) と一致させたいと考えています。ファイルに動的に名前を割り当てる方法はありますか?
perl - Perl で 1 つのディレクトリにある同じ拡張子の複数のファイルを読み取る
現在、1 つのディレクトリ内のファイルの読み取りに問題があります。ファイル内のすべての fastq ファイルを取得し、各ファイルに対してスクリプトを実行してから、新しいファイルを「Edited_sequences」フォルダーに配置する必要があります。私が持っていた1つのスクリプトは
1 つの fastq ファイルで最初の 80000 行を取得し、結果を出力します。たとえば、2000 個の fastq ファイルがある場合、2000 回コピーして貼り付ける必要があります。この状況に適した glob コマンド スーツがあることは知っていますが、その対処方法がわかりません。私を助けてください。
multithreading - bash スクリプトで並列プログラミング/マルチスレッドを使用するにはどうすればよいですか?
これは私のスクリプトです:
ここでは、ディレクトリ「source」に約 30 のサブディレクトリがあります。各サブディレクトリには特定のR1 .fastq.gz ファイルとR2 .fastq.gz ファイルがあり、それらを 1 つの R1.fastq.gz と R2.fastq.gz ファイルにマージしてから、マージしたファイルを宛先ディレクトリに保存します。私のコードは正常に動作しますが、データ量が多いため高速化する必要があります。スクリプトにマルチスレッド プログラミングを実装する方法はありますか? 複数のジョブが並行して実行されるようにスクリプトを実行するにはどうすればよいですか? bash スクリプトは初めてなので、助けていただければ幸いです。
c++ - QFileDialog はファイルの名前を「破棄」します
現在、バイオインフォマティクスに使用される一連のコンソール アプリケーションの GUI に取り組んでおり、Qt を使用した最初のプロジェクトとして最初のテストを行っています。GUIを作成するためにQtDesigner を使用しています.QFileDialogがファイル名の末尾を奇妙な文字に変換することを除いて、すべてが完全に機能します.
これが私のコードです:
ファイル名が正しくないというメッセージが表示されるため、fastq-dump プログラムは終了します。デバッグ後、ファイル名が/home/nsg/Downloads/SRR502947.sraから/home/nsg/Downloads/SRR502947.sra[ ]、場合によっては/home/nsg/Downloads/SRR5029[]
なぜこれが起こっているのか、それを修正する方法はありますか?
perl - Perl で同じファイル名のファイルをマージする
現在、Perl でファイルをマージする際に問題が発生しています。2 つのディレクトリ/フォルダーがあり、同じ名前と拡張子のファイルがペアで含まれています。たとえば、フォルダー 1 には、1.fastq、2.fastq、....、10.fastq というファイルがあります。フォルダー 2 には、まったく同じファイル名 1.fastq、2.fastq、....10.fastq がありますが、異なる情報が含まれています。同じ名前のファイルをマージしたいのですが、最初は cat コマンドを試しました
ただし、ファイルが多すぎる場合、たとえば 1000 以上の場合は、1000 回以上実行する必要があります。perl コマンドで自動的に行うにはどうすればよいですか?
前もって感謝します。
bash - sed/awk コマンドで Fastq から fasta フォーマットへ
fastq 形式のデータがあります。
awkコマンドを使用して各読み取りを「+」で分割したいのですが、機能しませんでした。see/awkを使用してfasta形式に変換できる簡単なコマンドはありますか?
期待される出力は
どうもありがとう!
perl - Bio Perl:ペアエンドデータを分割するコード?
私はバイオインフォマティクスの初心者で、ペアエンドの MiSeq データ (現在は 1 つの fastq ファイル) を 2 つのファイルに分割する小さな Bio Perl コードに取り組んでおり、各ファイルにはペアの一方の端が含まれています。ペアエンドリードの異なるエンドは、fastq ヘッダーのスペースの後の1または2で区別できます。このファイルは、コマンド ラインで「head」を使用する例のように、典型的な fastq 形式に従います。
一致を使用してヘッダーの 1 または 2 をターゲットにしようとするコードを作成しました。私は Bio::SeqIO を使用していますが、perl は fastq 形式を認識していないようで、このエラーが発生し続けます:
誰かが私のエラーを見つけて修正するのを手伝ってくれますか? BioPerl Web サイトから入手できる情報は、Bio::SeqIO が fastq 形式を認識できる必要があることを示しています。
ここに私が書いたコードがあります:
私の初心者の知識に助けてくれてありがとう。
〜アル
質問の更新:
行のコンマ エラーを修正しましたnew
が、コードを実行すると次のエラーが発生します。
私が行ったすべての読み取りは、BioPerl 自体の FASTQ パーサーにいくつかの問題があることを示しているようです。私は初心者であり、プログラミングのスキルを向上させようとしているので (私は完全に独学です)、このコードを機能させることを望んでいました。これは遅く、おそらく大きな FASTQ ファイルを操作するための最良の方法ではないというコメントに同意します。
+ 記述子に関しては、私のファイルを他のソフトウェア プログラム (例: CLC) で使用できるようにするために必要ですか、それとも FASTQ でその行を削除することで問題を解決できますか? + には、読み取りに関する品質情報は実際には含まれていませんね。
入力していただきありがとうございます。
python - Python辞書、奇数行をすべてキーに、偶数行をファイルから値にします
こんにちは、次のようなテキスト ファイルがあります。
私が欲しいのは:
上記のファイルから読み取り、行 1,3,5,7 ... を辞書キーに、行 2,4,5,8... を辞書値にします。
私のコードは次のとおりです。
コードは機能しましたが、テキスト ファイルの最小行数が 200,000 行であるため、非常に低速です。誰かがこれを行うためのより良い方法を持っていますか?
どうもありがとう。
==============フォローアップの質問を追加==================
これは、読み取り (レコード) ごとに 4 行の fastq 形式です。
ディクショナリを作成したいのですが、レコードの4行ごとにキーが1行目、値が2行目です。
辞書は次のようになります。
ありがとう。