私は問題に取り組んでいますが、実行時間が長くなりすぎるという問題があり、現在、可能な最適化を探しています。
質問:文字列または整数をhaskeyとして使用することで、パフォーマンスに(かなりの)違いはありますか?
問題は、文字列をキーとしてハッシュテーブルにノードが格納されたグラフがあることです。たとえば、キーは次のとおりです-「0011」または「1011」など。これで実行時間の改善を意味する場合は、これらも整数に変換できます。
整数は文字列よりもパフォーマンスが高くなります。以下は、両方のハッシュコード計算のコードです。
整数ハッシュコードの実装
/**
* Returns a hash code for this <code>Integer</code>.
*
* @return a hash code value for this object, equal to the
* primitive <code>int</code> value represented by this
* <code>Integer</code> object.
*/
public int hashCode() {
return value;
}
文字列ハッシュコードの実装
/**
* Returns a hash code for this string. The hash code for a
* <code>String</code> object is computed as
* <blockquote><pre>
* s[0]*31^(n-1) + s[1]*31^(n-2) + ... + s[n-1]
* </pre></blockquote>
* using <code>int</code> arithmetic, where <code>s[i]</code> is the
* <i>i</i>th character of the string, <code>n</code> is the length of
* the string, and <code>^</code> indicates exponentiation.
* (The hash value of the empty string is zero.)
*
* @return a hash code value for this object.
*/
public int hashCode() {
int h = hash;
if (h == 0) {
int off = offset;
char val[] = value;
int len = count;
for (int i = 0; i < len; i++) {
h = 31*h + val[off++];
}
hash = h;
}
return h;
}
パフォーマンスに問題がある場合、問題がHashMap/HashTableに起因する可能性はほとんどありません。文字列のハッシュは整数のハッシュよりも少し高価ですが、違いはかなり小さく、hashCodeはキャッシュされるため、同じ文字列オブジェクトを使用しても再計算されません。最初に整数に変換しても、パフォーマンスが大幅に向上する可能性はほとんどありません。
パフォーマンスの問題の原因を他の場所で探す方が、おそらくより有益です。コードのプロファイリングをもう試しましたか?
速度に違いがあります。HashMapsはhashCodeを使用して、そのコードに基づいてバケットを計算します。Integerの実装は、Stringの実装よりもはるかに簡単です。
そうは言っても、実行時間に問題がある場合は、適切な測定とプロファイリングを自分で行う必要があります。これが実行時間の問題を特定する唯一の方法であり、文字列の代わりに整数を使用しても、通常、パフォーマンスへの影響は最小限に抑えられます。つまり、パフォーマンスの問題は他の場所にある可能性があります。
たとえば、適切なマイクロベンチマークを実行する場合は、この投稿を参照してください。プロファイリングなどに利用できる他の多くのリソースがあります。