java - CPU キャッシュライン効率のための Java オブジェクトの最適化

Question

私はライブラリを書いています：

さまざまなプラットフォーム/Java 実装で実行する必要があります(一般的なケースは、Windows または Linux を搭載した Intel 64 ビットマシン上の OpenJDK または Oracle Java である可能性があります)。
オブジェクトアクセスのCPUキャッシュライン効率を気にするほど、高性能化が優先
一部の領域では、小さなオブジェクトの非常に大きなグラフがトラバース/処理されます (約 1 GB スケールとしましょう)。
主なワークロードはほぼ独占的に読み取りです
読み取りはオブジェクトグラフ全体に分散されますが、完全にランダムではありません (つまり、頻繁にアクセスされない領域への読み取りが時折行われる大きなホットスポットが存在します)。
オブジェクトグラフは、複数のスレッドによって同時にアクセスされます (変更はされません)。同時変更が発生しないという前提で、ロックはありません。

この種の環境で CPU キャッシュラインを効果的に利用できるように、小さなオブジェクトを設計するための経験則やガイドラインはありますか?

オブジェクトのサイズと構造を正しく設定することに特に関心があります。たとえば、最も頻繁にアクセスされるフィールドが最初のキャッシュラインに収まるようにするなどです。

注:これは実装に依存すること、ベンチマークを行う必要があること、時期尚早の最適化の一般的なリスクを十分に認識しています。これを指摘するために帯域幅を無駄にする必要はありません。:-)

score 11 · Accepted Answer

キャッシュラインの効率化に向けた最初のステップは、参照の局所性を提供することです (つまり、データを相互に近づけます)。ほとんどすべてがシステムによって割り当てられ、参照によってアクセスされる Java では、これを行うのは困難です。

参照を避けるために、次のことが明らかな場合があります。

これらのルールは、単一のオブジェクトで作業するとき、およびオブジェクトグラフ内のオブジェクト参照をトラバースするときに、少なくともある程度の参照局所性を保証します。

別のアプローチとして、データにオブジェクトをまったく使用せず、通常はクラスのフィールドである各項目に (同じサイズの) グローバルな非 ref 型付き配列を使用し、各インスタンスを共通のインデックスで識別することもできます。これらの配列に。

次に、配列またはそのチャンクのサイズを最適化するには、MMU の特性 (ページ/キャッシュサイズ、キャッシュライン数など) を知る必要があります。JAVA がこれをシステムクラスまたはランタイムクラスで提供するかどうかはわかりませんが、起動時にこの情報をシステムプロパティとして渡すことができます。

もちろん、これはJAVAで通常行うべきこととは完全に直交しています:)

よろしくお願いします

score 2 · Accepted Answer

CPU のさまざまなキャッシュに関する情報が必要になる場合があります。Java からCachesize (現在サポートされている Intel CPU) を使用してアクセスできます。これは、キャッシュ対応アルゴリズムの開発に役立ちます。

免責事項：ライブラリの作者。

java - CPU キャッシュ ライン効率のための Java オブジェクトの最適化