これは、一般的なUNIXライクなシステム(Python、Perl、awk、標準のUNIX utils {sort、uniq}など)で使用できる可能性が高い高水準言語であればどれでもかまいません。うまくいけば、2MBのテキストファイルの一意の用語の総数を報告するのに十分な速さです。
これは迅速な健全性チェックにのみ必要なので、適切に設計する必要はありません。
ケースに敏感であることを忘れないでください。
どうもありがとうございました。
補足:Pythonを使用する場合は、バージョン3のみのコードを使用しないでください。私が実行しているシステムには2.4.4しかありません。