データセットを表示するために、gephi を使い始めました。データセットには次が含まれます。
ノードとしてのタグ (特定の画像の用語)
これらのタグ間の正規化された Google 類似度重み付きエッジとしての距離(0 と 1 の間)
両方のタグが同じ画像に属している限り、すべてのタグは他のすべてのタグに接続されます。したがって、すべての画像に対してノードとエッジのクラスターが 1 つあります。
このデータセットを次の形式で gephi にインポートしました。
ノード: ID、ラベル
エッジ:ターゲット、ソース、重み (0 と 1 の間)
500 のノードと 6000 のエッジのように。
私の問題は、これらすべてのノードとエッジをインポートした後、グラフが実際の順序でまとまっていないように見えることです。すべての画像のすべてのクラスターは、他の画像の他のクラスターに混合されます。モジュール性をパーティション アルゴリズム (Louvain メソッドを使用する必要があります) として使用すると、グラフが色付けされ、各色が画像を表します。Force Atlas 2 レイアウトを使用して、この混乱を分割できます。
15 個のクラスターのような色付きのグラフができました (すべてのクラスターが 1 つの画像を表します)。
ここで、正規化された Google 距離 (エッジの重み) に従ってタグ (ノード) を使用してこれらのクラスターを再度クラスター化したいと考えています。
私が達成したいことを皆さんが理解してくれることを願っています。それを明確にするために写真をアップロードすることもできます。
どうもありがとう