Pythonで簡単なメールランキングプログラム(優先受信トレイのようなもの)を作成しようとしています。送信者から受信した電子メールの頻度に基づいて、たとえば、送信者の頻度がカウントされるたとえば50%のトレーニングセットを用意し、次にトレーニングに基づいて順番にランク付けされた50%のテストセットを用意します(つまり、電子メール大量のメッセージを送信する送信者からのランクが高くなります)。
メールを受け取り、それぞれから「From」アドレスを抽出するPythonコードをいくつか作成しました。この情報を、最も一般的な電子メール送信者を示すリストに配置しました(以下のこのリストのスニペットの例)。
//(Email address, frequency of emails received from this sender)//Not Code
('tester1@csmining.org', 244)
('tester2@csmining.org', 162)
('tester3@csmining.org', 154)
('tester4@csmining.org', 75)
('tester5@csmining.org', 50)
必要なことを実行するためにデータをトレーニングおよびテストするために、多くの機械学習アルゴリズムを効果的に使用できることを認識しています。しかし、私はこれらのどれを使用して最良の結果を得ることができるかわかりませんか?