基本的に、カラースケールが各列の値の範囲に基づいているヒートマップを生成できるかどうかを知りたいです。ソリューションは、必ずしもクラスタリングを実行したり、デンドログラムを生成したりする必要はありません。
さまざまな種類の変数を持つデータ フレームがあります。連続変数もあれば、ダミー変数または序数変数もあります。データを数値としてクラスタリング関数に渡す必要があること、およびここでのクラスタリングには daisy() 関数が最適なオプションであることを理解しています。
heatmap と heatmap.2 で作成したようなヒートマップを作成したいのですが、スケーリングによって視覚化に問題が発生します。この質問は、daisy() を heatmap.2 で動作させる方法を理解するのに役立ちましたが、列ごとのスケーリングは、ダミー変数に割り当てられた色が列ごとに異なることを意味します。たとえば、ダミー変数を含むすべての列の赤 = 1 と白 = 0 の代わりに、平均と標準偏差が異なるため、色合いが非常に大きくなります。または、スケーリングをオフにすると、データセット全体で色合いに変化はほとんどありません。色の範囲は、各列ではなく、データ フレーム全体の範囲に基づいているようです。
時間があれば、いくつかの例を追加してみます。
編集
わかりましたので、それは明らかに不明確でした。
私が遭遇したヒートマップの例では、データフレーム全体の最小値と最大値に基づいて色をスケーリングしています。したがって、次のようなデータフレームが与えられます。
Row Var 1 Var2
1 1 1
2 -5 10
3 0 7
青を最低のセルに、白を中間値を、赤を最高のセルに設定します。結果は次のようになります。
Row Var 1 Var2
1 White White
2 Blue Red
3 Blue Red
代わりに、スケールを各列の値に依存させ、結果を次のようにします。
Row Var 1 Var2
1 White Blue
2 Blue Red
3 Red White