java - Javaのハッシュキーとして文字列と整数のどちらが速いですか？

Question

私は問題に取り組んでいますが、実行時間が長くなりすぎるという問題があり、現在、可能な最適化を探しています。

質問：文字列または整数をhaskeyとして使用することで、パフォーマンスに（かなりの）違いはありますか？

問題は、文字列をキーとしてハッシュテーブルにノードが格納されたグラフがあることです。たとえば、キーは次のとおりです-「0011」または「1011」など。これで実行時間の改善を意味する場合は、これらも整数に変換できます。

score 3 · Accepted Answer

整数は文字列よりもパフォーマンスが高くなります。以下は、両方のハッシュコード計算のコードです。

整数ハッシュコードの実装

/**
     * Returns a hash code for this <code>Integer</code>.
     *
     * @return  a hash code value for this object, equal to the 
     *          primitive <code>int</code> value represented by this 
     *          <code>Integer</code> object. 
     */
    public int hashCode() {
    return value;
    }

文字列ハッシュコードの実装

 /**
     * Returns a hash code for this string. The hash code for a
     * <code>String</code> object is computed as
     * <blockquote><pre>
     * s[0]*31^(n-1) + s[1]*31^(n-2) + ... + s[n-1]
     * </pre></blockquote>
     * using <code>int</code> arithmetic, where <code>s[i]</code> is the
     * <i>i</i>th character of the string, <code>n</code> is the length of
     * the string, and <code>^</code> indicates exponentiation.
     * (The hash value of the empty string is zero.)
     *
     * @return  a hash code value for this object.
     */
    public int hashCode() {
    int h = hash;
    if (h == 0) {
        int off = offset;
        char val[] = value;
        int len = count;

            for (int i = 0; i < len; i++) {
                h = 31*h + val[off++];
            }
            hash = h;
        }
        return h;
    }

score 2 · Accepted Answer

パフォーマンスに問題がある場合、問題がHashMap/HashTableに起因する可能性はほとんどありません。文字列のハッシュは整数のハッシュよりも少し高価ですが、違いはかなり小さく、hashCodeはキャッシュされるため、同じ文字列オブジェクトを使用しても再計算されません。最初に整数に変換しても、パフォーマンスが大幅に向上する可能性はほとんどありません。

パフォーマンスの問題の原因を他の場所で探す方が、おそらくより有益です。コードのプロファイリングをもう試しましたか？

score 1 · Accepted Answer

速度に違いがあります。HashMapsはhashCodeを使用して、そのコードに基づいてバケットを計算します。Integerの実装は、Stringの実装よりもはるかに簡単です。

そうは言っても、実行時間に問題がある場合は、適切な測定とプロファイリングを自分で行う必要があります。これが実行時間の問題を特定する唯一の方法であり、文字列の代わりに整数を使用しても、通常、パフォーマンスへの影響は最小限に抑えられます。つまり、パフォーマンスの問題は他の場所にある可能性があります。

たとえば、適切なマイクロベンチマークを実行する場合は、この投稿を参照してください。プロファイリングなどに利用できる他の多くのリソースがあります。

java - Javaのハッシュキーとして文字列と整数のどちらが速いですか？

3 に答える 3

Related

Reference