Excelスプレッドシートを操作するためのpythonスクリプトを作成しようとしています。
サンプルデータがあるとします。
Gene chrom strand TSS TES Name
NM_145215 chr5 + 135485168 135488045 Abhd11
NM_1190437 chr5 + 135485021 135488045 Abhd11
NM_1205181 chr14 + 54873803 54888844 Abhd4
NM_134076 chr14 + 54878906 54888844 Abhd4
NM_9594 chr2 + 31615464 31659747 Abl1
NM_1112703 chr2 + 31544075 31659747 Abl1
NM_207624 chr11 + 105829258 105851278 Abl1
NM_9598 chr11 + 105836521 105851278 Ace2
NM_1130513 chrX + 160577273 160626350 Ace2
NM_27286 chrX + 160578411 160626350 Ace2
これらの類似した名前 (列 6) については、最小の TSS で行全体を取得したいと考えています。たとえば、最初の 2 行の Abhd11 名については、TSS 135485021 < 135485168 であるため、結果の 2 行目を保存したいと考えています。同じ名前を持つすべてのセットについても同様です。
アイデアやコメントは大歓迎です。