私はプログラミングが初めてで、そもそも何をする必要があるかを実際に見つけようとするのに苦労しています。どんな助けでも素晴らしいでしょう。
問題: 特定の行にある "C" の数をカウントする必要があるいくつかのファイルがあり、#ofC と合計文字数を得るためにこれを出力する必要があります。これには、各ファイルで分析する必要がある数百万行があります。データは 4 行にグループ化されており、必要なデータは 2 行目にのみ含まれています。
ファイルの例:
@M00859:19:000000000-A60W6:1:1101:17503:1628 1:N:0:1
TTATGTATTAAAATTAAGTTTTTTATAAAGTTATTTATTTTGGTTTGATTGGAACGACGAAGAAGTTGTTATATTTTTAAATTGGGAAATTGGAATTATTTGATTAGAAAGTGGGATAATTTTTTTATTTTAATTTTTATTAGATTTATTTAAGTTTTTGGTGTTTTTATAATTTTTTATGTATTTAAATTAAGTTTTTTATGAAGTGATTTAT
+
GGBGBGFHHG3A1DGDEDHGHHGGAG22FBGGFGHHFHHHHG?GGH?FGHB0DGHFCG???//CCHGFHHEGEHHHHHECBGGG1?EFGGH1EF1GHBHFGBFDHEB1GBED11//GB1FFGHHGGHHHHHB1FHFHHEHHE11GHHHHHHFFFHHHHG?CHGHGHHGHHFBHHHHHGHGGHFHHHHBFHHHHEHHHHGGGGFGFBFBFFGGGG
最終的な目的は、各ファイルの C の数と総文字数の散布図を作成して、ファイル間の結果を比較できるようにすることです。
どんな助けでも素晴らしいでしょう!
乾杯、ジャスティン