これが私の問題です。
次のように、リストのリストがあります。
linesort=[
['Me', 1, 596],
['Mine', 1, 551],
['Myself', 1, 533],
['Myself', 1, 624],
['Myself', 1, 656],
['Myself', 1, 928],
['Theirs', 1, 720],
['Theirs', 1, 1921],
['Them', 1, 716],
['Themselves', 1, 527]
]
各サブリストは、参加者が単語を正しくまたは間違って分類するのにかかった時間 (2 番目の値) と、応答するまでの時間 (3 番目の値) を表します。私がやりたいことは、単語、各リストの 2 番目の値の合計、および 3 番目の値の平均を含むリストの別のリストを返すことです。
基本的に、各サブリストの最初の要素を比較し、それらが等しい場合は、2 番目の要素の合計と 3 番目の要素の平均を計算する必要があります。
これを手動で行うことはできましたが (変数を手動で割り当てて作成するなど)、ループ内でこれを行う試みはすべて失敗しました。この種のデータを含む 2 つの非常に大きなテキスト ファイルがあることを考えると、プログラムによる解決策があれば幸いです。
役立つかもしれないいくつかのポイント: 各テストで使用される単語は事前に知っていますが、それらがどこに表示されるかはわかりません (また、刺激のいずれかのグループに表示される場合でも)。誰でもこれで私を助けることができますか?
Ubuntu 10.04 で Python 2.6.5 を使用しています。