私は問題があります。scipy.stats f_oneway()ANOVAを、次のようなnumpy配列のグループを含むデータアーカイブをロードするスクリプトで実行したいと思います。
archive{'group1': array([ 1, 2, 3, ..., ]),
'group2': array([ 9, 8, 7, ..., ]),
...}
今私の問題は、グループの数が異なるデータアーカイブに対して固定されていないことです。つまり、アーカイブにグループがいくつあるか(また、必ずしもそれらの名前が何であるかはわかりません)、事前にはわかりません。
一元配置分散分析のscipy実装は、次のように入力としてコンマ区切りの配列のみを受け入れます。
a = array([ 1, 2, 3, ..., ])
b = array([ 9, 8, 7, ..., ])
c = array([ 5, 6, 4, ..., ])
scipy.stats.f_oneway(a, b, c)
リスト、タプル、多次元配列をすべて提供しようとしましたが、成功しませんでした。したがって、現在、このANOVA実装を使用できる唯一の方法は、毎回グループ変数を手動で入力することです。これにより、スクリプトでこれを実行することが事実上不可能になります。これを解決する方法や、f_oneway()のこれらの非常に具体的なデータ形式の要件を回避する方法を知っている人がいるかどうか疑問に思います。