java - Java Collections Framework の一般的なメソッド (サイズ) の予想外の複雑さ?

Question

最近、いくつかの Java コレクションが size() メソッドの一定時間操作を持たないという事実に驚いています。

コレクションの同時実装では、同時実行性 (ConcurrentLinkedQueue、ConcurrentSkipListSet、LinkedTransferQueue などのサイズは O(n)) のトレードオフとしていくつかの妥協点があることを知りましたが、これは API ドキュメントで適切に文書化されています。

私が気になったのは、一部のコレクションのメソッドによって返されるビューのメソッドサイズのパフォーマンスです。たとえば、TreeSet.tailSetは、要素が fromElement 以上のバッキングセットの部分のビューを返します。私が非常に驚いたのは、返された SortedSet の size の呼び出しが時間的に線形であること、つまり O(n) だということです。少なくともそれは、OpenJDK のソースコードから掘り出すことができたものです。 TreeSet では、TreeMap のラッパーとして実装され、TreeMap 内には、サイズメソッドが次のような EntrySetView クラスがあります。

abstract class EntrySetView extends AbstractSet<Map.Entry<K,V>> {
    private transient int size = -1, sizeModCount;

    public int size() {
        if (fromStart && toEnd)
            return m.size();
        if (size == -1 || sizeModCount != m.modCount) {
            sizeModCount = m.modCount;
            size = 0;
            Iterator i = iterator();
            while (i.hasNext()) {
                size++;
                i.next();
            }
        }
        return size;
    }

    ....
}

これは、サイズが最初に呼び出されるのは O(n) であり、バッキングマップが変更されない限りキャッシュされることを意味します。API ドキュメントでこの事実を見つけることができませんでした。より効率的な実装は、サブツリーサイズのキャッシュでメモリのトレードオフを伴う O(log n) です。このようなトレードオフはコードの重複 (TreeMap のラッパーとしての TreeSet) を回避するために行われているため、パフォーマンス上の理由からそれらを行うべきではない理由がわかりません。

TreeSet の OpenJDK 実装の私の (非常に簡単な) 分析が正しいか間違っているかは無視して、そのような多くの操作、特に完全に予想外の操作のパフォーマンスに関する詳細で完全なドキュメントがあることを知りたいですか?

score 3 · Accepted Answer

たとえば、TreeSet.tailSet要素がより大きいか等しいバッキングセットの部分のビューを返しますfromElement。私が非常に驚いたのは、size返されたの呼び出しSortedSetが時間的に線形であること、つまりO(n).

私にとって、それは驚くべきことではありません。javadoc の次の文を検討してください。

「返されたセットはこのセットによってサポートされているため、返されたセットの変更はこのセットに反映され、その逆も同様です。」

テールセットはバッキングセットの動的ビューであるため、実際にはそのサイズを動的に計算する必要があります。別の方法では、バッキングセットに変更が加えられたときに、現存するすべてのテールセット (およびヘッドセット) ビューのサイズを調整する必要があります。これにより、バッキングセットの更新のコストが高くなり、ストレージ管理の問題が発生します。(ビューのサイズを更新するために、バッキングセットはすべての既存のビューセットへの参照を必要とします。これは潜在的な隠しメモリリークです。)

これで、ドキュメントに関するポイントが得られました。しかし実際には、javadocs はビューコレクションの複雑さについて何も述べていません。そして、実際、それTreeSet.size()がO(1)!であることさえ文書化していません。実際には、add、、removeおよびcontains操作の複雑さのみを説明しています。

そのような多くの操作、特に完全に予期しない操作のパフォーマンスに関する詳細で完全なドキュメントがあることを知りたいですか?

私の知る限り、いいえ。確かに、Sun / Oracleからではありません...

java - Java Collections Framework の一般的なメソッド (サイズ) の予想外の複雑さ?

1 に答える 1

Related

Reference