各キーに辞書自体の値がある辞書を作成しようとしています。次のコードの問題は、新しい場合に新しい項目が辞書に追加されないことです
dict_features = {}
def regexp_features(fileids):
for fileid in fileids:
if re.search(r'мерзавец|подлец', agit_corpus.raw(fileid)):
dict_features[fileid] = {'oskorblenie':'1'}
else:
dict_features[fileid] = {'oskorblenie':'0'}
if re.search(r'честны*|труд*', agit_corpus.raw(fileid)):
dict_features[fileid] = {'samoprezentacia':'1'}
else:
dict_features[fileid] = {'samoprezentacia':'0'}
return dict_features
結果はdictです
{'neagitacia/20124211.txt': {'samoprezentacia': '0'}, 'agitacia/discreditacia1.txt': {'samoprezentacia': '0'}
しかし、私は必要です
{'neagitacia/20124211.txt': {'oskorblenie':'1', 'samoprezentacia': '0'}, 'agitacia/discreditacia1.txt': {'oskorblenie':'0', 'samoprezentacia': '0'}