algorithm - リーフセットが異なるツリーの比較 (リーフノードの数とラベルが異なる)

翻译自：https://stackoverflow.com/questions/20902294 2014-01-03T11:12:12.423

292 次

ツリーの構築に使用するファイル/フォルダー構造からの階層データがあります。私は今、これらの木をランダムなものと比較しようとしています。

ランダムツリーと比較するために、リーフノードの数とラベルを保持し、従来のツリー距離メトリック (たとえば、ロビンソンフォールズ距離) を使用できます。それにもかかわらず、さまざまなデータからのさまざまなツリーを比較するために（葉とラベルの数が異なる）、どのメトリック/アルゴリズムを使用すればよいかわかりません。助言がありますか？

ありがとう！

PS-比較の目的は、これらのツリー間のトポロジーがどの程度類似しているかを確認し、どのクラスターが存在するかを確認することです (したがって、フォルダー構造の背後にある生成メカニズムの考えにいくつかの証拠を追加します)。

algorithm - リーフ セットが異なるツリーの比較 (リーフ ノードの数とラベルが異なる)

0 に答える 0

Related

Reference

algorithm - リーフセットが異なるツリーの比較 (リーフノードの数とラベルが異なる)