次の問題があります。単語とその出現頻度を含む word_count という defaultdict があります。これは、Google Speech API の応答をカウントすることで得られます。しかし、この API は、ドイツ語の文字 'ö' に対して '\303\266' のようなものを返します。ここで、この辞書を調べて、上記のいずれかが存在するかどうかをテストし、次のように正しいものに置き換えます。
defaultdict を埋める:
word_count = defaultdict(int)
for line in fileinput.input([file]):
line = line.strip()
words = line.split()
for word in words:
word_count[word] += 1
これまでのところ問題なく動作し、辞書を印刷でき、数字で単語を取得できます。
キーを交換します:
for key,val in word_count:
if '\\303\\266' in key:
new = key.replace('\\303\\266', 'ö')
word_count[new] = word_count.pop(key)
整数が必要なため、 pop(key) できないため、これは機能しません。他にどうすればいいですか?いくつかのアプローチを試しましたが、ここでは何もうまくいかないようです。
どんな助けでも大歓迎です!
解決:
辞書を並べ替えてタプルのリストに変えたので、これは私のせいでした。これを理解するのを手伝ってくれたみんなに感謝します!