各列が特定の変数である Excel スプレッドシートがあります。列の最後に、A、B、C、または D の「タイプ」と呼ばれる特別な最後の列があります。
各行は、最後の列に記録された特定の「タイプ」バケット (A/B/C/D) に収まるさまざまな変数を持つデータ ポイントです。
特定のタイプ ("C" または "C"|"D" など) のすべてのエントリを調べて、どの変数がこの最後の列の適切な予測因子であるか、どの変数が優れているかを調べる方法が必要です。他の人よりも予測者。
一部の変数は数値であり、他の変数は (一連の文字列からの) 固定文字列であるため、単なる数値と数値の相関関係ではありません。
Excel 2003 はそのための優れたツールですか、それともこれを容易にする優れた統計プログラムはありますか? カテゴリごとにピボット/ヒストグラムを作成する必要がありますか?またはこれらのクエリを実行するためのより良い方法はありますか? ありがとう