次のように、100ポイントの辞書のリストがあります。
datapoint1 a:1 b:2 c:6
datapoint2 a:2 d:8 p:10
.....
datapoint100: c:9 d:1 z:12
次のようにリストをファイルに出力したい:
a b c d ...... z
datapoint1 1 2 6 0 ...... 0
datapoint2 2 0 0 8 ...... 0
.........
.........
datapoint100 0 0 9 1 ...... 12
ここで言及すると、a、b、c...z は、たとえば実際の単語数が事前にわかっていないため、単語の総数は 26 ではなく、1000/10000 であり、a、b、... . 'my'、'hi'、'tote' などの実際の単語に置き換えられます。
私はそれを次のようにしようと考えていました:
- 単語の辞書を作成し、それをグローバル辞書と呼びましょう
- 次に、各辞書がデータポイントを表す辞書のリストを作成します
- 次に、辞書のリストをグローバル辞書にマップしようとしています
しかし、この方法はpythonでは複雑に思えます。Pythonでそれを行うより良い方法はありますか?