SAM 形式では、各アライメント ラインはセグメントの線形アライメントを表し、各ラインには 11 個の必須フィールド (QNAME、FLAG、RNAME、POS、MAPQ など) があります。
特定の BAM ファイル内のすべての「QNAMES」の NumPy 配列が必要だとしましょう。または、複数の列を取得して Pandas Dataframe にインポートすることもできます。
この機能は pysam で可能ですか?
自然に特定の BAM ファイルを で開き、pysam.AlignmentFile()
個々のセグメントにアクセスするpysam.AlignmentSegment()
ことができます。
seg = AlignmentSegment()
print(seg.qname)
ただし、すべての QNAMES を NumPy 配列に保存できますか?