-sizeの行に応じて、A
-sizeの特定の列のみを維持して結合する必要がある 2 つの Numpy 配列があります。(888, 1114253)
B
(555861, 3)
問題は、のヘッダーA
が55730
: 各列に 2 つの値があることです!
A
つまり、ヘッダーが の行に対応する列のみを取得したいのですB
が、A
各列は「ダブル」です
例を挙げて説明します:
A
:
family id mum dad rs1 rs2 rs3 rs4 rs5 rs6 rs7 rs8 rs9 rs10 rs11 rs12
1 1 4 6 A T A A T T C C G G A T A G A A G A T A G G C C
2 2 7 9 T A G A C T C T G A T T A A A C G G T A C C C T
3 3 2 8 T T G G C T C T G G A T A G A C G G T T C C C C
4 4 5 1 A A A A T T C C G A T T A A A A G A T A G C C T
このファイルでは、各rsxxx
列ヘッダーに対応する 2 つの列があるため、ファイルを配列として読み取ることができるように、それらをまとめる方法を見つける必要があります。
B
:
1 rs1 2345
1 rs2 2346
2 rs5 2348
4 rs8 2351
4 rs12 2360
望ましい出力は
Output
:
family id mum dad rs1 rs2 rs5 rs8 rs12
1 1 4 6 A T A A G G A A C C
2 2 7 9 T A G A G A A C C T
3 3 2 8 T T G G G G A C C C
4 4 5 1 A A A A G A A A C T
アイデア?
コンソール上
B
:
array([['1', 'rs3094315', '752566'],
['1', 'rs12562034', '768448'],
['1', 'rs3934834', '1005806'],
...,
['23', 'rs2032612', '21866491'],
['23', 'rs2032621', '21872738'],
['23', 'rs2032617', '21896261']],
dtype='<S10')