4

ある種のページランキングを行うアルゴリズムを探していますが、ページが古くなるにつれて価値が低下します。

私が見たすべてのアルゴリズムは反対のことをします (古いドメインにより多くの価値を与えます)。

そのようなアルゴリズムを見つけるのを手伝っていただければ幸いです。

編集:私の最初の質問を見ると、私が何を求めているのか少し不明確だったと思います.質問は当初考えていたよりも複雑です. 基本的に私が欲しいのは、サイト B が投稿した直後にサイト A がサイト B にリンクした場合、サイト B のページが追加のページ ランクを取得する (スコアの方が適切な言葉かもしれません)、ある種のランキング アルゴリズムです。投稿が行われてから長い時間が経過してサイト B にリンクされた場合、ページ ランクにはほとんど追加されません。

うまくいけば、これは理にかなっています。最初の質問が間違っていたことをお詫びします。

4

1 に答える 1

5

この記事で Haveliwala が説明しているように、偏ったページ ランクを使用できます。

通常のランダム コンポーネントを使用する代わりに、アイデアは単純[1/n,1/n,....,1/n]ですf(doc)。 doc) は新しいページほど高く、Sigma(f(doc)) = 1[コレクション内のすべてのドキュメントの場合、ランダム コンポーネントは次のようになります。[f(doc1),f(doc2),...,f(docn)]

ドキュメントごとに が である必要があることに注意してくださいf(doc)>0。それ以外の場合、収束は保証されません [ペロン-フロベニウスの定理は適用されません]。


もう 1 つの可能性は、通常のページ ランクを計算し、それを各ページに数値を与える別の関数で乗算することです。ページが新しいほど、このドキュメントのスコアは高くなります。g:Collection->R

編集:
元の質問の編集への応答として:
別の可能性は、Web 用のグラフを生成する場合、追加情報w:E->[0,1]を追加することです。つまり、各エッジに重み関数を追加し、それがどれほど重要かを示します。元のリンクの直後にリンクが作成された場合編集すると、w(e) は 1 に近づき、それよりずっと遅い場合、スコアは 0 に近づきます。

ページランクを計算するマトリックスを作成するときMatrix[v1][v2] <- w((v1,v2))は、グラフにエッジが存在することを示す単純なバイナリ値の代わりに を入れます。
このマトリックスを取得したら、通常どおり PageRank を計算します。

于 2011-09-21T09:06:20.730 に答える