さて、私はそれについて何度も何度も考えましたが、私はPythonの初心者であり、解決策は見つかりません。これは私がする必要があることです:私はその後ろにあらゆる種類のオランダ語の単語と数字を含むLIWCからのテキストファイルを持っています:
aaien 12 13 32
aan 10
aanbad 12 13 14 57 58 38
...
次に、LIWCからテキストファイルがあり、その後ろに番号とカテゴリがあります。
01:Pronoun
02:I
03:We
04:Self
05:You
06:Other
...
そして今、私は自分のコーパスをこれらのカテゴリーのオランダ語の単語とリンクさせることになっています。したがって、最初にオランダ語をLIWC単語リストのオランダ語の後ろの数字にリンクする必要があり、次にそれらの数字をこれらのカテゴリにリンクする必要があります...の辞書を作成すると便利だと思いましたLIWCの両方のリスト。これは私がこれまでに持っているものです:
with open('LIWC_words.txt', 'rU') as document:
answer = {}
for line in document:
line = line.split()
if not line: #empty line
continue
answer[line[0]] = line[1:]
with open ('LIWC_categories.txt','rU') as document1:
categoriesLIWC = {}
for line in document1:
line = line.strip()
if not line:
continue
key, value = line.split(':')
if key.isdigit():
categoriesLIWC[int(key)] = value
else:
categoriesLIWC[key] = value
だから私は今2つの辞書を持っています...しかし今私は立ち往生しています。誰かが私が次に何をすべきか考えていますか?(私は主にNLTKで作業する必要があるため、Python 2.6.5で作業します)