トレンドトピックの約100件のツイートを表示するアプリケーションがあります。問題は、それらの多くが本当に類似している(つまり、異なるURLを持つ同じツイート)ということです。そのため、私は本当に類似したツイートを無視したいと思います。
私はPythonでこれを行うための効率的な方法を見つけようとしています。これを解決するためにhttp://code.google.com/p/pylevenshtein/を使用することを考えていますが、多くのツイートを相互に比較する必要があり、もっと簡単な方法があるかもしれません。