2

無向グラフのクラスタリング係数 [ CC ] (ローカルおよびグローバル) をドット形式で計算するプログラムを C++ でコーディングしています。私の問題は、私のプログラムの結果がRからの出力と一致しないことです( igraphライブラリを使用):

私のプログラム:

The cluster coefficient of "0"  is: 0.257 (88/342)
The cluster coefficient of "1"  is: 0.444 (40/90)
The cluster coefficient of "10" is: 1.000 (2/2)
The cluster coefficient of "2"  is: 0.418 (46/110)
The cluster coefficient of "11" is: 1.000 (2/2)
The cluster coefficient of "12" is: 0.667 (8/12)
The cluster coefficient of "3"  is: 0.346 (54/156)
The cluster coefficient of "5"  is: 0.571 (24/42)
The cluster coefficient of "13" is: 1.000 (12/12)
The cluster coefficient of "4"  is: 0.607 (34/56)
The cluster coefficient of "7"  is: 0.679 (38/56)
The cluster coefficient of "14" is: 1.000 (6/6)
The cluster coefficient of "15" is: 0.833 (10/12)
The cluster coefficient of "16" is: 1.000 (6/6)
The cluster coefficient of "17" is: 0.733 (22/30)
The cluster coefficient of "9"  is: 0.833 (10/12)
The cluster coefficient of "18" is: 0.714 (30/42)
The cluster coefficient of "19" is: 1.000 (6/6)
The cluster coefficient of "6"  is: 1.000 (2/2)
The cluster coefficient of "8"  is: 0.733 (22/30)

ここで、「」はグラフのノードであり、(n/m) の数字は「その近傍内の頂点間のリンク」(n) と「それらの間に存在する可能性のあるリンクの数」(m) です。それぞれ (ウィキペディアからの説明) R からの出力:

0  0.2631579        x (+2 links)
1  0.4666667        x (+2 links)
2  0.4181818
3  0.3461538
4  0.6071429
5  0.6190476        x (+2 links)
6  1.0000000
7  0.6785714
8  0.6666667        x (-2 links)
9  0.8000000
10 1.0000000
11 1.0000000
12 0.6666667
13 1.0000000
14 1.0000000
15 0.8333333
16 1.0000000
17 0.7333333
18 0.7142857
19 1.0000000

各行の最初の数字はNode、2 番目はローカルCCで、3 番目は出力と一致しない場合の注釈です ( Rに一致するように追加/削除する必要があるリンク (n) の数を指定します)の出力)。

私が抱えている2番目の問題は、 RからのグローバルCCが私の定義またはウィキペディアの定義と一致しないことです(式を誤解していない限り)。このグラフのRからの出力は0.458891で、私のものは0.742です


だから私はそれを手動で行いました.8のCCを計算し、プログラムの出力と一致させました. だから私の質問は、「igraph ライブラリにバグがある可能性さえありますか?」ということです。答えが「いいえ」の場合: 「何が足りないのですか?」

グラフ ファイルは次のとおりです。

graph {
  1 -- 0;
  10 -- 0;
  10 -- 2;
  11 -- 0;
  11 -- 2;
  12 -- 0;
  12 -- 1;
  12 -- 3;
  12 -- 5;
  13 -- 0;
  13 -- 3;
  13 -- 4;
  13 -- 7;
  14 -- 0;
  14 -- 1;
  14 -- 4;
  15 -- 0;
  15 -- 2;
  15 -- 3;
  16 -- 0;
  16 -- 15;
  16 -- 3;
  17 -- 0;
  17 -- 1;
  17 -- 2;
  17 -- 5;
  17 -- 7;
  17 -- 9;
  18 -- 0;
  18 -- 1;
  18 -- 2;
  18 -- 3;
  18 -- 4;
  18 -- 7;
  19 -- 0;
  19 -- 18;
  19 -- 3;
  2 -- 0;
  2 -- 1;
  3 -- 0;
  3 -- 2;
  4 -- 0;
  4 -- 1;
  4 -- 3;
  5 -- 0;
  5 -- 2;
  5 -- 3;
  6 -- 0;
  6 -- 3;
  7 -- 0;
  7 -- 1;
  7 -- 2;
  7 -- 3;
  7 -- 4;
  8 -- 0;
  8 -- 1;
  8 -- 2;
  8 -- 3;
  8 -- 4;
  8 -- 5;
  9 -- 0;
  9 -- 1;
  9 -- 5;
}

RでCCを計算する方法は、たとえば、グラフを var "f" にロードする (または、ドット ファイルを読み取ることができないため、新しいグラフを生成する) ことでありグローバルCCおよび推移性 ( f、「ローカル」)ローカルのもの。

読んでくれてありがとう。下手な英語でごめんなさい。

4

1 に答える 1

7

ここの igraph の作成者の 1 人です。

あなたのグラフを igraph (Python インターフェース) にロードしたところ、その結果は最後の桁まであなたのものと一致します。どのバージョンの igraph を使用していますか?

「グローバル」クラスタリング係数に関しては、少なくとも 2 つの矛盾する定義があることに注意してください。

  1. ネットワーク全体の三角形の数を計算し、可能な三角形の数で割ります。これは「実際の」グローバル クラスタリング係数であり、igraph はデフォルトでこれを計算します。

  2. 各ノードのローカル クラスタリング係数を計算し、平均を取ります。これは「平均ローカル」クラスタリング係数であり、これを計算しています。

于 2011-07-07T19:44:22.710 に答える