約 20,000,000 エントリのリストがあります。約 5,000,000 のエントリが一意です。リストを反復処理し、一意のエントリを識別し、それぞれに 0 から 5,000,000 までの整数を割り当てる必要があります。
現在、各エントリを順番に TreeSet に追加し、.headSet() を使用してどこに移動したかを調べます。これは最適ではないと思います。
while((nextline = wholefile.listIterator().next()) != null){
//sorted, unique, addition
keywords.add(nextline);
//hmmm, get index of element in TreeSet?
k_j = keywords.headSet(nextline).size();
}
.add() を呼び出したときに場所を取得する方法はありますか?