毎日生成される約 30,000 行と 25 列の非常に大きな csv ファイルがあります。関心のある行のみが含まれるように、このファイルをフィルタリングする必要があります。形式は次のとおりです。
date, time, user, entity, party1, party2
20131001, 00:01, user1, ABC, XXX, XXX
20131002, 00:01, user2, XYZ/ABC, XXX, ABC
20131003, 00:01, user1, DEF, ABC, XXX
たとえば、entity=ABC を持つすべての行を削除する必要があります。どちらかを考えていました
ファイルを読み込んで、ABC を含む各行を削除しますが、実際に必要な行が削除されます。削除するエンティティ列に ABC を含む行のみを削除したい。
Python で csv モジュールを使用して、同じことを達成してみてください。csv で利用可能な関数を読みましたが、列ごとにフィールドで区切ることができるものは何も提供していないようです。
必ずしもコードで答えを探しているわけではありませんが、この問題を解決する方法に関する一般的なアドバイスは大歓迎です。
どうもありがとう。