0

各列が特定の変数である Excel スプレッドシートがあります。列の最後に、A、B、C、または D の「タイプ」と呼ばれる特別な最後の列があります。

各行は、最後の列に記録された特定の「タイプ」バケット (A/B/C/D) に収まるさまざまな変数を持つデータ ポイントです。

特定のタイプ ("C" または "C"|"D" など) のすべてのエントリを調べて、どの変数がこの最後の列の適切な予測因子であるか、どの変数が優れているかを調べる方法が必要です。他の人よりも予測者。

一部の変数は数値であり、他の変数は (一連の文字列からの) 固定文字列であるため、単なる数値と数値の相関関係ではありません。

Excel 2003 はそのための優れたツールですか、それともこれを容易にする優れた統計プログラムはありますか? カテゴリごとにピボット/ヒストグラムを作成する必要がありますか?またはこれらのクエリを実行するためのより良い方法はありますか? ありがとう

4

1 に答える 1

0

Microsoft Excel を使用して、特にデータをクリーンアップする (つまり、データ値を 1 つのタイプ、文字列、または数値に変更する) ために、何らかのフィルタリングを行うことができます。Execl はデータマイニングも行います。ただし、この種の問題については、WEKA をお勧めします。このツールを使用すると、すべてのデータ インスタンス (行) の連想分類予測 (つまり、クラス アソシエーション ルール マイニング) を行うことができるため、どのアイテムが A/B/C/D に属するかを判断できます。あなたの特別な属性はあなたのクラス属性になります。

于 2013-12-17T11:34:59.840 に答える