java - すべてのエントリが同じインデックスの下にリンクされた方法で格納されている場合、HashMap スペースが拡張される理由

Question

Java HashMap のソースコードから、スペースのしきい値に達すると、そのスペースが 2 倍に拡張されることは明らかです。

6 つの要素すべてがリンクされた方法で同じインデックスの下に格納されるユースケースについて考えました。7 番目の要素が到着すると、しきい値 7 (10*.75) の HashMap (サイズ 10) が展開されます。ここでは、すべてが 1 つのインデックスの下に保存されるため、実際には拡張の必要はありません。

親切に私を教えてください

        void addEntry(int hash, K key, V value, int bucketIndex)
        {
            Entry<K,V> e = table[bucketIndex];
            table[bucketIndex] = new Entry<K,V>(hash, key, value, e);
            if (size++ >= threshold)
                resize(2 * table.length);
        }

        void resize(int newCapacity)
        {
            Entry[] oldTable = table;
            int oldCapacity = oldTable.length;
            if (oldCapacity == MAXIMUM_CAPACITY) {
                threshold = Integer.MAX_VALUE;
                return;
            }

            Entry[] newTable = new Entry[newCapacity];
            transfer(newTable);
            table = newTable;
            threshold = (int)(newCapacity * loadFactor);
        }

score 3 · Accepted Answer

HashMapはこれらのエントリを保持できるため、サイズを変更する必要はないと言います。

ただし、HashMap理想的には一定のアクセス時間を提供する必要があります ( O(1))。このアクセス時間を提供しようとするために、サイズ変更が行われます。バケットを再編成することにより、キーのルックアップは理想的には値が 1 つだけのバケットを参照する必要があります (エントリのリストを繰り返し処理することを避けるため)。

メソッドには、次のget()行があります。

for (Entry<K,V> e = table[indexFor(hash, table.length)];

HashMap はindexFor()メソッドを使用してバケットを識別し、バケットを反復処理して一致するキーを見つけます。これを最適化するために、反復は理想的には 1 回だけ行う必要があります (バケットルックアップを避けることはできません)。

intこれは、ハッシュコードが理想的には範囲 (2^31-1)に均等に分散されていることを示しています。オブジェクトのハッシュコードを定数 (たとえば 1) にすることはできますが、HashMap はすべてのエントリを 1 つのバケットにダンプする以外に何もできないことがわかり、その結果、パフォーマンスが影響を受けます。

score 1 · Accepted Answer

それは単なる設計上の決定です。おそらく、マップは取得と保存が非常に高速である必要があり、非常に多くのエントリをリンクすると、パフォーマンスに影響するという事実に基づいています。したがって、再ハッシュすると、アイテムが 1 つのバケットだけにリンクされたままになるのではなく、おそらくバケット全体にアイテムがまばらになります。

score 0 · Accepted Answer

の取引です。サイズが小さいときに同じバケットにあるすべての要素は、サイズが大きくなると分散します。これにより、パフォーマンスが向上します。

java - すべてのエントリが同じインデックスの下にリンクされた方法で格納されている場合、HashMap スペースが拡張される理由

3 に答える 3

Related

Reference