ポイントシステムを使ってジャンクメールからメールを仕分けるプログラムを作りたいです。
メールのいくつかの単語について
、プログラムで「ジャンクワード」として分類された単語ごとに異なるポイントをプログラムに与えて、各単語に異なるポイントを割り当てて、各単語にある程度の価値があるようにしたいポイントの。
私の疑似コード:
- ファイルからテキストを読み取る
- 「ジャンクワード」を探す
- 出てくる単語ごとに、その単語の価値を示します。
- 各ジャンクワードの合計ポイントが 10 の場合は、"SPAM" と続けて、ファイル内にあり、ジャンクワードとして分類された単語のリストとそのポイントを出力します。
例 (テキストファイル):
Hello!
Do you have trouble sleeping?
Do you need to rest?
Then dont hesitate call us for the absolute solution- without charge!
したがって、プログラムを実行して上記のテキストを分析すると、次のようになります。
SPAM 14p
trouble 6p
charge 3p
solution 5p
だから私が書くつもりだったのは、このマナーでした:
class junk(object):
fil = open("filnamne.txt","r")
junkwords = {"trouble":"6p","solution":"3p","virus":"4p"}
words = junkwords
if words in fil:
print("SPAM")
else:
print("The file doesn't contain any junk")
だから今私の問題は、ファイルに出てくるリストの各単語にどのようにポイントを与えるかということです? そして、プログラムがすべき
ように合計ポイントを合計する方法、
ファイル内にある「ジャンクワード」のリストと各単語の合計ポイントが続きます..if total_points are > 10
print "SPAM"