0

ユーザートランザクションの次のようなデータがあります。

email_id

ayush.jain@gmail.com
a.yushjain@gmail.com
ay.ushjain@gmail.com
ayus.hjain@gmail.com
ayush.jain1@gmail.com
ayush.jain+1@gmail.com
ayush.jain+3@gmail.com
praneet.parekh@gmail.com
pra.neet.parekh@gmail.com
praneet.parekh+10@gmail.com
p.raneet.parekh@gmail.com

これは大きなデータセットです。ここでは、詐欺ユーザーの例を 2 つだけ示しました。この種のメールをキャプチャしたい。シーケンス クラスタリングを使用することを念頭に置いています。python-3.xで実装できるそのようなアルゴリズムを知っている人はいますか?

4

0 に答える 0