1

クエリと関連するクリックされた URL の 2 部グラフがあります。これらのクエリに基づいて、クエリをクラスター化します。2 つのクエリが同じかどうかを判断するために、単純なセット ベースの式を使用する予定です。私の初期入力データは次の形式です。

Url   Queries   
Url1   Q1, Q2, Q3   
Url2   Q1, Q5, Q6   

この問題を解決するための適切なアルゴリズムを決定するのに苦労しています。

どんな助けにも感謝します。

4

0 に答える 0