遺伝子解析用の.bedファイルを作成しようとしています。私はPythonの初心者です。私が作成したいファイルは、タブで区切られた3列で、最初の列は常に同じ(染色体番号)で、サイズ200の2列目と3列目のウィンドウはゼロから始まり染色体の終わりで終わる必要があります。例えば:
chr20 0 200
chr20 200 400
chr20 400 600
chr20 600 800
...
私は染色体のサイズを持っているので、現時点では、列2 <(クロムのサイズ)の印刷行で'と言いたいと思っています。私はスクリプトのスケルトンを持っていますが、経験が不足しているため、うまく機能していません。これが私がこれまでに持っているものです:
output = open('/homw/genotyping/wholegenome/Chr20.bed', 'rw')
column2 = 0
column1 = 0
while column2 < 55268282:
for line in output:
column1 = column1 + 0
column2 = column2 + 100
print output >> "chr20" + '\t' + str(column1) + '\t' + str(column2)
誰かがこの単純なスクリプトを私が説明したように修正できるか、または本当に感謝されるより良い解決策を書くことができれば。20番染色体とchrXのすべてのファイルを出力できるスクリプトを作成することを検討しましたが、染色体のサイズを指定する必要があるため、各ファイルを個別に実行する必要があると思います。
前もって感謝します!