5

アフィリエイトプログラムを運営しています。サインアップしたユーザーは、他のユーザーの募集に成功するとポイントを獲得できます。しかし、スパマーはこのプログラムを悪用し、多数のアカウントを自動的に登録しています。明らかに機械で生成されたアカウントを閉鎖することで、これを防ぎたいと考えています。これに対する私の考えは、機械で生成されたアカウント名を識別するプログラムを作成するか、少なくとも手動で検査するサブセットを選択することです。

これまでのところ、2 種類の異常な ID があることがわかりました。

  1. 1 つ目は、次のように、いくつかの ID が他の ID と非常によく似ていることです。

    • wss12345
    • wss12346
    • wss12347
    • テスト1
    • テスト2
    • ...
  2. 2 つ目は、次のように、ルールなしでランダムに生成されたように見える ID がいくつかあることです。

    • MiDjiSxxxDekiE
    • ニムジクジクスリー
    • DAFDAB7643
    • ...

1 つ目は、レーベンシュタイン (編集) 距離を使用します。このメソッドは、タイプ 1 で説明したいくつかの ID を見つけることができます (私はこれを行い、良好なパフォーマンスを得ることができます)。

2 つ目は、次のように ID の確率を計算できます。

id = "DAFDAB7643:
p(id) = p(D)*p(A|D)*p(F|A)*p(D|F)*...*p(3|4)

そのため、確率を使用して異常な ID を除外できます。(あくまで想像ですので、試していません。)

このトピックについて他の提案をしてくれる人はいますか? 他にどのようにこの問題に取り組むことができますか? 私の試みに欠陥や脱落が見られますか?

4

2 に答える 2

1
  1. これらの新しいアカウントが採用担当者の ID を参照していると仮定すると、特定の採用担当者に関連付けられた新規アカウントの割合および/または完全な数を調べることができます。

  2. IP アドレスなどの分析によって、複数のユーザーが同じコンピューターからアクセスしているかどうかがわかる場合もあります。

  3. 私は単語の辞書を使用し、貧弱なパスワードを検出するのとは逆のことを行います-人間のユーザー名には、辞書の単語、個人名、句読点の欠如、繰り返し文字を含めない、ほとんど小文字にする必要があります。

  4. 上記の 1. に戻るようなものです -- 採用担当者が異常に密集した ID のクラスターを持っている場合、既に特定した機能を使用すると、適切なフラグになります。これは、本質的に、質問のすぐ下にある@larsmansのコメントである可能性があると思います。

パスワード チェック アルゴリズム (項目 3) を再利用することで何らかのメリットが得られるかどうか知りたいです。

于 2012-08-29T20:43:09.433 に答える
0

あなたが運営しているサイトの種類を教えてくれないので、これは少し推測に過ぎません。しかし、スタック オーバーフローは、ユーザー評価システムを使用して適切な行動を促進し、多くの種類の望ましくない行動を排除することに成功した代表的な例と考えてください。

休眠中のリクルート アカウントの数が増えると、スコアから段階的に減点するという手っ取り早いハックな修正方法があるかもしれませんが、サイトのコンテンツに実際に貢献したことに対して、より高い評価スコアを与えることで、よりやりがいがあり説得力のある修正を行うことができます。ただし、これはサイトの種類によって異なります。たとえば、株式市場のヒント サイトは、技術的なディスカッション フォーラムとは明らかに機能が異なります。

于 2012-08-30T03:42:26.740 に答える