ボキャブラリ ツリー、k-ary
深さのあるツリー データ構造を使用しています。L
これは、階層的k-means
クラスタリングを繰り返し実行した結果です。クラスターに割り当てられたデータ ポイントの数がクラスターの数よりも少ない場合、クラスター化プロセスが停止する可能性があるため、これは不均衡な構造です。
私の問題は、このツリーをマトリックス形式で保存する必要があることです。
単純に幅優先の順序で格納することを考えましたが、実際のノード数 (たとえばn
) とバランス ツリー内の理論上のノード数との差が大きくなると、メモリの浪費が大きくなりすぎる可能性があります。つまり、次のようになります。
n << (1-k^L)/(1-k)
メモリを無駄にしたり、可能な限り無駄にしたりすることなく、不均衡なツリーをマトリックス形式で効率的に格納する方法はありますか?