私には2つのパスがあります
path1 = "/home/x/nearline"
path2 = "/home/x/sge_jobs_output"
path1 には、一連の fastq ファイルがあります。
ERR001268_1.recal.fastq.gz
ERR001268_2.recal.fastq.gz
ERR001269_1.recal.fastq.gz
ERR001269_2.recal.fastq.gz
.............
path2 には、path1 の fastq ファイルに対応する多くの .txt があります。
ERR001268_1.txt
ERR001268_2.txt
ERR001269_1.txt
ERR001269_2.txt
.............
これで、path1 の fastq ファイルから fastq_seq_num を計算するスクリプトを作成しました。以下を参照してください。
for file in os.listdir(path1):
if re.match('.*\.recal.fastq.gz', file):
fullpath1 = os.path.join(path1, file)
#To calculate the sequence number in fastq.gz files
result = commands.getoutput('zcat ' + fullpath1 + ' |wc -l')
fastq_seq_num = int(result)/4.0
print file,fastq_seq_num
また、path2 の .txt ファイルから num_seq_processed_sai を計算します。以下を参照してください。
for file in os.listdir(path2):
if re.match('.*\.txt', file):
fullpath2 = os.path.join(path2, file)
#To calculate how many sequences have been processed in .sai file
linelist = open (fullpath2,'r').readlines
lastline = linelist[len(linelist)-1]
num_seq_processed_sai = lastline.split(']')[1].split()[0]
print file,num_seq_processed_sai
さて、私の問題は次のとおりです。パス1の最初のfastqファイルのfastq_seq_numを計算するループを作成したいです。次に、path2 の FIRST txt ファイルの num_seq_processed を計算します。次に、この 2 つの数値を比較します。その後、ループを終了します。次に、2 番目のループが開始されます...これを実現するためにループを設計するにはどうすればよいですか? ありがとう!!!