5

Pagerankは、一連のページのノードグラフと、それぞれの内向きおよび外向きのリンクによって形成される有向エッジで機能します。したがって、特定のページのランクは、ノードグラフで広く局所的に誘発される効果です。

一方、SVDは値のマトリックス全体で機能し、方向性はありません。サイトAとサイトBの間のリンクは、正しいマトリックス要素で1としてのみ登録されます。これはグローバルシステムであるため、ランキングはグローバルな効果です。

Webから派生したマトリックスが極端にまばらであることを考えると、SVDは完全なデータセットを必要とし、かなりのメモリ要件があるため、ここではパフォーマンスが悪いと予想されます。

本当?Pagerankは主にノードグラフベースのアルゴリズムであるためSVDを上回っていますか?Pagerankは、単語が言及された回数を超えて、ページから意味的関連性をどのように推測できますか?それとも、Pagerankがページをランク付けした後に実行される2番目のステップでしょうか?

4

2 に答える 2

4

ここには 2 つの問題があります。計算が簡単な測定値と、探している情報が得られる測定値はどちらでしょうか。どちらの質問に対する答えもわかりませんが、おそらく部分的な答えを出すことができます。

まず、関連性。どちらの量も、ネットワーク理論の用語を使用する中心性の尺度です。PageRank は固有ベクトルの中心性 (の変形) を計算しますが、SVD は明らかに Hyperlink-Induced Topics Search (HITS) アルゴリズムにつながります。これは、ピーター・ドッズ (バーモント大学) からの配布資料から入手しました。それらはさまざまなものを測定しますが、ウェブページの重要性を測定するのにどれが最も関連性があるかは明確ではありません.

次に、計算コストです。数学的に言えば、ウィキペディアのページで説明されているように、PageRank は (修正された) 隣接行列の優勢な固有ベクトルですが、HITS は隣接行列の優勢な特異ベクトルを与えます。両方とも、ウェブページとそれらの間のリンクのグローバル ネットワークによって定義され、両方ともノード グラフをローカルに考慮するだけで計算できます。一見すると、計算コストは​​ほぼ等しいと思います。

結論として、なぜ PageRank が SVD よりも優れているのかわかりません。それがSVDよりも優れていることは私には明らかではありません。

于 2009-12-08T17:15:14.940 に答える