私は2つの2D numpy配列の形をしています:
(19133L, 12L)
(248L, 6L)
いずれの場合も、最初の 3 つのフィールドが識別子を形成します。
2番目のマトリックスにも存在する識別子を持つ行のみが含まれるように、より大きなマトリックスを縮小したいと考えています。したがって、形状は(248L、12L)である必要があります。これどうやってするの?
次に、(3 3 4) が (3 3 5) の後に来るように、配列が最初の値、2 番目の値、3 番目の値でインデックス付けされるように並べ替えたいと思います。複数フィールドの並べ替え機能はありますか?
編集:
私はパンダを試しました:
df1 = DataFrame(arr1.astype(str))
df2 = DataFrame(arr2.astype(str))
df1.set_index([0,1,2])
df2.set_index([0,1,2])
out = merge(df1,df2,how="inner")
print(out.shape)
しかし、これは (0,13) 形状になります