私はいくつかのデータをソートするのに本当に必死です。Python を使用して CSV で並べ替えたいデータがあります。誰かが助けてくれれば、それは大歓迎です。行数が多すぎる (>1500 万) ため、Excel で並べ替えることができません。
形式は次のとおりです。
X,Y,Level,ID,XYID
15.5,16.5,1.6,HB01,15.516.5
15.5,17.5,1.4,HB01,15.517.5
15.5,18.5,1.7,HB01,15.518.5
15.5,19.5,1.6,HB01,15.519.5
15.5,20.5,1.2,HB01,15.520.5
15.5,20.5,1.9,HB02,15.520.5
15.5,20.5,2.5,HB03,15.520.5
15.5,20.5,2.1,HB04,15.520.5
XYID は、X と Y を連結したテキストです。データを並べ替えて、2 番目のブロックで、最高レベル (3 列目) を持ち、同じ XYID を持つため、出てくる唯一の行が次のようになるようにします。
15.5,20.5,2.5,HB03,15.520.5
そして、最終出力を最初の 4 行を表示する csv ファイルにしたいのは、XYID が異なり、新しい 5 行目が最大レベルを示す行であるためです。
X,Y,Level,ID,XYID
15.5,16.5,1.6,HB01,15.516.5
15.5,17.5,1.4,HB01,15.517.5
15.5,18.5,1.7,HB01,15.518.5
15.5,19.5,1.6,HB01,15.519.5
15.5,20.5,2.5,HB03,15.520.5