私は常にこのコマンドラインを使用して、一意の行のみを並べ替えて取得します。これは、大きなファイル(500,000行以上)でも魅力的に機能します
sort filename.txt | uniq | sponge filename.txt
最短の同等の python コードは次のようになります
f = open("filename.txt", "r")
lines = [line for line in f]
lines = lines.sort()
lines = set(lines)
もちろん、これはメモリの制約のためにスケーラブルではなく、Pythonでスケーラブルなコードを書くには時間がかかるので、Pythonで最も短い同等のコード(パッケージ)は何ですか