TAB形式(TABの代わりに空白を使用してすべての列がに含まれるようにする)の種類の500 000行(さまざまなクラブのメンバーへのアドレス)のテキストファイルがあります。
一部の行はほとんど同じです(1つの列のみが異なります。1人が2つのクラブのメンバーになることができます)。自宅の住所が同じなので、どの重複行を削除してもかまいませんが、そのうちの1つを削除する必要があります。
EXCEL(TEXT-TO-CELLで重複を見つけて削除します。ただし、形式がTABまたはCSV形式ではないため、列のテキストパターンが失われます。
NOTEPAD ++またはTEXTPADで正規表現を記述して使用するにはどうすればよいですか?