r - ヒートマップ、複数の変数タイプ、R でのスケーリング

Question

基本的に、カラースケールが各列の値の範囲に基づいているヒートマップを生成できるかどうかを知りたいです。ソリューションは、必ずしもクラスタリングを実行したり、デンドログラムを生成したりする必要はありません。

さまざまな種類の変数を持つデータフレームがあります。連続変数もあれば、ダミー変数または序数変数もあります。データを数値としてクラスタリング関数に渡す必要があること、およびここでのクラスタリングには daisy() 関数が最適なオプションであることを理解しています。

heatmap と heatmap.2 で作成したようなヒートマップを作成したいのですが、スケーリングによって視覚化に問題が発生します。この質問は、daisy() を heatmap.2 で動作させる方法を理解するのに役立ちましたが、列ごとのスケーリングは、ダミー変数に割り当てられた色が列ごとに異なることを意味します。たとえば、ダミー変数を含むすべての列の赤 = 1 と白 = 0 の代わりに、平均と標準偏差が異なるため、色合いが非常に大きくなります。または、スケーリングをオフにすると、データセット全体で色合いに変化はほとんどありません。色の範囲は、各列ではなく、データフレーム全体の範囲に基づいているようです。

時間があれば、いくつかの例を追加してみます。

編集

わかりましたので、それは明らかに不明確でした。

私が遭遇したヒートマップの例では、データフレーム全体の最小値と最大値に基づいて色をスケーリングしています。したがって、次のようなデータフレームが与えられます。

Row    Var 1  Var2
1      1      1
2     -5     10
3      0      7

青を最低のセルに、白を中間値を、赤を最高のセルに設定します。結果は次のようになります。

Row    Var 1  Var2
1      White  White
2      Blue   Red
3      Blue   Red

代わりに、スケールを各列の値に依存させ、結果を次のようにします。

Row    Var 1  Var2
1      White  Blue
2      Blue   Red
3      Red    White

r - ヒートマップ、複数の変数タイプ、R でのスケーリング

0 に答える 0

Related

Reference