クエリと関連するクリックされた URL の 2 部グラフがあります。これらのクエリに基づいて、クエリをクラスター化します。2 つのクエリが同じかどうかを判断するために、単純なセット ベースの式を使用する予定です。私の初期入力データは次の形式です。
Url Queries
Url1 Q1, Q2, Q3
Url2 Q1, Q5, Q6
この問題を解決するための適切なアルゴリズムを決定するのに苦労しています。
どんな助けにも感謝します。
クエリと関連するクリックされた URL の 2 部グラフがあります。これらのクエリに基づいて、クエリをクラスター化します。2 つのクエリが同じかどうかを判断するために、単純なセット ベースの式を使用する予定です。私の初期入力データは次の形式です。
Url Queries
Url1 Q1, Q2, Q3
Url2 Q1, Q5, Q6
この問題を解決するための適切なアルゴリズムを決定するのに苦労しています。
どんな助けにも感謝します。