0

「a..,z」、「A,..、Z」、「スペース」、「.」の記号を見つけなければなりません。一部のデータでは「、」。

私はコードを試しました:

fh = codecs.open("mydata.txt", encoding = "utf-8")
text = fh.read()
fh1 = unicode(text)
dic_freq_signs = dict(Counter(fh1.split()))
All_freq_signs = dic_freq_signs.items()
List_signs = dic_freq_signs.keys()
List_freq_signs = dic_freq_signs.values()

しかし、それは私が探しているものではなく、すべての兆候を取得しますか? 誰でも助けることができますか?

(そしてそれはユニコードでなければなりません)

4

2 に答える 2

0

辞書の繰り返しを確認してください..

All_freq_signs = [ item for item in dic_freq_signs.items() if item.something == "somevalue"]
def criteria(value):
    return value%2 == 0
All_freq_signs = [ item for item in dic_freq_signs.items() if criteria(item)]
于 2015-01-14T08:46:20.317 に答える