大きなデータセットをより有用なデータにソートする方法を理解するのに問題があります。
CSV形式の元のファイルを以下に示します。データはx、y、zの位置、最後にエネルギーを示しています。x、y、z座標は、これが以下の小さなスニペットであるかなりの方法で広がりました-基本的に、それはボリュームのエネルギー検索でした。
-2.800000,-1.000000,5.470000,-0.26488315
-3.000000,1.000000,4.070000,-0.81185718
-2.800000,-1.000000,3.270000,1.29303723
-2.800000,-0.400000,4.870000,-0.51165026
残念ながら、必要な4次元でプロットするのは非常に難しいため、このデータをトリミングする必要があります。ボリュームを最低エネルギーのz軸上の表面に変えるような方法でこれを行いたいと思います。小さいデータセットでは、これは単純で、X、Y、エネルギーの順に並べ替えてから、最低値を超えるすべてのエネルギーを削除します。これは小さなデータセットには十分簡単でしたが、すぐに問題になりました。
csvを分割したり、sortコマンドを使用したりするなど、さまざまな方法を試しましたが、うまくいきません。これにアプローチする方法についてのアドバイスをいただければ幸いです。