0

重み付けされた有向グラフの隣接行列Aが与えられた場合(したがって、行列要素は0/1だけでなく、行列は対称ではありません)、新しいエッジを予測するための良い方法はありますか?

一部の接続の既知のエッジと観測されていない接続のNULL値を持つ非常に大きな(数十億のノード)データセットがあり、既知のエッジを使用して観測されていない接続を予測したいと思います。

メソッドが正確でない場合は問題ありません。実際、データサイズと処理速度についてマトリックスをできるだけスパースに保つために、予測がしきい値を下回っている場合は、エッジをNULLまたは0に保ちたいと思います。

何かご意見は?

4

1 に答える 1

1

ランダム グラフ生成とグラフ マイニングの文献を詳しく調べたいと思うかもしれません。特に、スケールフリー ネットワークで機能します。簡単なインターネット検索で、関連性のある論文がいくつか見つかりました。

与えられた参照は、いくぶん恣意的な選択と考えてください。膨大な数の関連リソースが期待されます。

私自身の大ざっぱな高レベルの考え: 実際のグラフの (統計) プロパティ、重みの集計測定、またはそれらの統計分布に関する情報はありますか? サンプリング戦略の特性 (特にバイアス) に関する情報はありますか? あなたの観察はタイムタグ付きですか?

統計モデルがある場合は、最尤推定を調べてください。これまでに観測された接続のみがあり、それらが iid であると仮定できる場合は、観測のセットにブートストラップ法を適用して、グラフ プロパティの統計を推定できます (例: 次数/の平均/分散/など)。接続性/胴回り/体重など)。問題の測定値によっては、このトラックが過剰になる可能性があります。一連の観測値に偏りがないと仮定し、代わりに指定されたグラフから測定値を計算してください。

この情報を、キックオフ グラフでの初期化を可能にするランダム グラフ ジェネレーターにフィードします。

この概要がお役に立てば幸いです。よろしくお願いします。

于 2013-02-15T16:28:27.783 に答える