pagerank - Hadoopを使用したページランク

Question

Hadoopとページランクの使用経験を積みたいと思います。Hadoopを使用したページランクアルゴリズムの簡単な実装が完了しました。ここで、いくつかのアルゴリズムパラメータを変更した場合に考えられる影響を分析し、それがページランクにどのように影響するかを調査する予定です。今のところ、ぶら下がっているノードがページランクにどのように影響するかを分析しています。このページランクに他にどのようなバリエーションを加えることができるかについての提案は、私がいくつかのより深い知識を得るのに大いに役立ちます。

ありがとう

score 2 · Accepted Answer

私が知っているいくつかのバリエーション：

加重PageRankアルゴリズム：ページのランク値をアウトリンクページ間で均等に分割するのではなく、より重要な（人気のある）ページに大きなランク値を割り当てます。
トピックに敏感なページランク。

検索クエリ結果のランキングを改善するための元のPageRankアルゴリズムでは、Webのリンク構造を使用して、特定の検索クエリに関係なく、Webページの相対的な重要性をキャプチャする単一のPageRankベクトルが計算されます。検索結果では、特定のトピックに関する重要性の概念をより正確にキャプチャするために、一連の代表的なトピックを使用してバイアスされた一連のPageRankベクトルを計算することを提案します。
Z.Gy¨ongi、H。Garcia-Molina、およびJ. Pedersen、「<ahref="http://www.vldb.org/conf/2004/RS15P3.PDF"rel="nofollow">リンクスパムとの戦いトラストランク付き」</li>
また、HITS（ハイパーリンク環境の信頼できるソース）を試すこともできます。
さらに進んで、 TupleRank：拡張K多部グラフのランダムウォークを使用したリレーショナルデータベースのランキングのように、ページランクのアイデアを他のドメインに適用してみることができます。

pagerank - Hadoopを使用したページランク

1 に答える 1

Related

Reference