辞書式順序をM個の偶数サイズのバケット(+/- 1文字列)に分割したいN個の文字列があります。また、N>>M。
直接的な方法は、すべての文字列を並べ替えて、結果のリストをM個のバケットに分割することです。
代わりに、完全なリストが利用可能になる前に、作成された各文字列をバケットにルーティングすることで、これを概算したいと思います。
文字列をバケットに割り当てるための高速でPythonの方法はありますか?私は基本的に、整数モジュロ演算子の文字列に相当するものを探しています。おそらく、辞書式順序を保持するハッシュですか?それも可能ですか?