4

単一のウェブページの重要性を示すことができるアルゴリズム/テクニックを探しています。PageRankは別として、コンテンツ、構造、および相互のハイパーリンクに基づいてそのような評価を行う他の方法はありますか?

PageRankのようにwww.foo.comからwww.bar.comへの接続だけでなく、www.foo.com /barからwww.foo.com/bazなどへの接続についても話します(これらのニーズにPageRankを適合させる)

重要性を「定義」するにはどうすればよいですか。このコンテキストでの重要性は、「ユーザーにとってこの側面がどれほど重要であり、サイトの他の部分にとってもどれほど重要であるか」と考えています。
たとえば、クリスマスラッフルはスタートページで発表され、このサイトにつながるリンクは1つだけで、ユーザーにとってもサイトにとっても重要です。すべてのサイトからのリンクがあるインプリント(ほとんどがフッターのどこかにあるため)は、多くのリンクがありますが、重要ではありません。インプリントは、ページの目的(=情報の提供、製品の販売、一般的なサービスなど)に実際の価値を与えないため、「ユニット」としてのサイトにとっても重要ではありません。

4

2 に答える 2

1

もう1つの有名なアルゴリズムは、ハブとオーソリティ(HITS)です。基本的に、あなたはあなたのページをハブ(多くのアウトバウンドリンクを持つページ)とオーソリティ(多くのインバウンドリンクを持つページ)のどちらかに分類します。

しかし、あなたは本当にあなたが重要性によって何を意味するかを定義するべきです。本当に重要とはどういう意味ですか?PageRankは、インバウンドリンクに関してそれを定義します。それがPageRankの定義です。

あなたが写真を持っていることとして重要であると定義するならば、あなたは写真が好きだからです。次に、ページ内の写真の数などの重要な指標を考え出すことができます。別のメトリックは、写真サイトからのインバウンドリンクの数である可能性があります(、、...など)flickr.com500px

重要の定義を使用すると、 `1-(インバウンドリンクの数をサイトのページ数で割ったもの)を使用できます。これにより、0から1までの数値が得られます。0は重要ではないことを意味し、1は重要であることを意味します。

このメトリックを使用すると、サイトのすべてのページに表示されるインプリントの重要度は0になります。リンクが1つしかないクリスマスセールページの重要度はほぼ1になります。

于 2011-10-16T12:26:13.940 に答える
1

HITSよりも安定しているSALSAもあります[スパムの影響が少ない]。

あなたはページの文脈にも興味があるので、トピックに敏感なページランクに関するHaveliwalaの仕事を見てみたいと思うかもしれません

于 2011-10-16T12:32:47.273 に答える