3

2 つの異なるソーシャル メディア サイトの 2 つのプロファイルが同じかどうかを確認するにはどうすればよいですか? これを達成し、それによって一致の重み測定を割り当てるためにどのようなアルゴリズムが存在しますか?

LinkedIn からのプロファイルと Facebook からの別のプロファイルがあるとします。私はこれら 2 つのプロファイルの特性を知っています。これら 2 つのプロファイル間の一致する距離を見つけるためにどのアルゴリズムを実装できますか。

ありがとうアビシェクS

4

1 に答える 1

6

機械学習アルゴリズム、特に分類を試すことができます

簡単にするために、バイナリの答えが必要であると仮定しましょう: はいまたはいいえ (これは後で改善できます)。

あなたがしなければならないこと:

  1. 2 つのプロファイルから機能を抽出し、結合された 2 つのプロファイルに対して単一のインスタンスを作成します。これは、分類する必要があるインスタンスになります
  2. トレーニング セットを作成します。トレーニング セットは、分類がわかっている「インスタンス」のセットです (通常、手動でラベル付けすることにより)。
  3. トレーニング セットを指定して、分類アルゴリズムを実行します。これにより、後で取得する未分類のインスタンスの分類が「推測」されます。

使用したいアルゴリズムは次のとおりです。

  1. SVM - 多くの人が考えている最高の分類アルゴリズムは、今日存在します。
  2. ディシジョン ツリー- 特にC4.5 - 非常に直感的な分類子 (人間が読める!) で、使いやすく、分類時間も非常に短い。
  3. K Nearest Neighbor - 直感的で使いやすいですが、機能の数が多い場合は動作が悪くなります。

    • 交差検証を使用して、結果がどの程度優れているかを評価することもできます。
    • Java の場合、これらの分類アルゴリズムなどを実装するWekaというオープン ソース プロジェクトがあります。
于 2012-05-25T06:12:52.207 に答える