次の問題があります。
頂点 v0、v1、...、vN として表される Web ページのリストがあります。
私はグラフ g0、g1、...、gM を持っています。これらには、次のような Web サイトへのアクセス中にユーザーがアクセスしたページを示すエッジ リストがあります。
- g0: (v3、v44) ; (v44、v5)
- g1: (v3、v44) ; (v44、v5) ; (v5、v7)
- ...
- GM: ...
このデータを使用して、Web ページの訪問パターンのクラスターを作成したいと考えています。
探しているもの: 1. この問題の解決に役立つアルゴリズムの論文、ブログなど。2. オープン ソース コード、この問題に取り組むコード フラグメント。
前もって感謝します。
ノート:
グラフ クラスタリング アルゴリズムを認識し、使用しています。このアプリケーションに固有のものを探していました。