私はPythonが初めてで、この問題で多くの問題を抱えています.これは私が仕事のためにやらなければならないことです.
Excel ファイルの背景: 3 列、約 100 行あります。最初の列 (col1) には、A または B が含まれます。2 番目の列 (col2) には、1 から 10 までの任意の数値が含まれます。3 番目の列 (col3) には、任意の 10 進数の値が含まれます。
プログラムに実行させたいのは、データを解析することです。col1 と col2 の重複が多数存在します。たとえば、(A, 1) は行 1、5、20、98 などにありますが、col3 は異なる数値になります。したがって、3 列目の異なる数値については、それらすべての数値の平均を求めたいと思います。
出力は次のようになります。
A, 1 = avg 4.32
A, 2 = avg 7.23
A, 3 = avg -9.12
etc etc (until number 10)
B, 1 = avg 3.76
B, 2 = avg -8.12
B, 3 = avg 1.56
etc etc (until number 10)
完全なアルファベット順および数字順である必要はありません。最初に見つかったコンボを出力するだけでかまいません。コンボ数はわずか3。
import xlrd #import package
#opening workbook and reading first sheet
book = xlrd.open_workbook('trend.xls')
sheet = book.sheet_by_index(0)
#function to hold unique combos
unique_combinations = {}
#looping through data
for row_index in range(sheet.nrows):
#declaring what group equals to what row
col1 = sheet.cell(row_index, 0)
col2 = sheet.cell(row_index, 1)
col3 = sheet.cell(row_index, 2)
unique_combo = (col1.value, col2.value)
if unique_combinations.has_key(unique_combo):
unique_combinations[unique_combo].append(col3.value)
else:
unique_combinations[unique_combo] = [col3.value]
for k in unique_combinations.keys():
l = unique_combinations[k]
average = sum(l) / len(l)
print '%s: %s Mean = %s' % (k[0], k[1], average)
基本的には2グループで、その2グループ内に10グループがあり、その10グループに属する数の平均です。
助けてください!よろしくお願いします。
Excel ファイルのサンプル:
col1 | col2 | col3
A | 1 | 3.12
B | 9 | 4.12
B | 2 | 2.43
A | 1 | 9.54
B | 8 | 2.43
A | 2 | 1.08
プログラムが行うことは、最初に出くわした組み合わせが A, 1 であることを確認し、3.12 をリストに格納し、次のものを見て、4 番目の重複に出くわすまで格納し続けます。行。そして、その値も保存します。そして最後に、出力には A, 1 = avg (3.12 + 9.54 / 2) が表示されます。この例は、A, 1 コンボのみを示しています。しかし、実際には (例のように) 2 つのグループしかありませんが、col2 の範囲は 1 から 10 です。多くの重複があります。