これは、多くのtxtファイルの1つがどのように見えるかのコピーです。
Class 1:
Subject A:
posX posY posZ x(%) y(%)
0 2 0 81 72
0 2 180 63 38
-1 -2 0 79 84
-1 -2 180 85 95
. . . . .
Subject B:
posX posY posZ x(%) y(%)
0 2 0 71 73
-1 -2 0 69 88
. . . . .
Subject C:
posX posY posZ x(%) y(%)
0 2 0 86 71
-1 -2 0 81 55
. . . . .
Class 2:
Subject A:
posX posY posZ x(%) y(%)
0 2 0 81 72
-1 -2 0 79 84
. . . . .
- クラス、サブジェクト、行エントリの数はすべて異なります。
- Class1-Subject Aには、常に0と180が交互に現れるposZエントリがあります
- クラス別および科目別のx(%)、y(%)の平均を計算します
- クラス別および主題別のx(%)、y(%)の標準偏差を計算します
- また、平均とstd_deviationsを計算するときは、180行のposZを無視してください。
私は(マクロとVBAを使用して)Excelで扱いにくいソリューションを開発しましたが、Pythonでより最適なソリューションを探したいと思います。
numpyは非常に便利ですが、.mean()、. std()関数は配列でのみ機能します。私はまだ、パンダのgroupby関数と同様にそれについてさらに調査しています。
最終的な出力は次のようになります(1.クラス別、2。件名別)
1. By Class
X Y
Average
std_dev
2. By Subject
X Y
Average
std_dev