私は立ち往生しているので、誰かが私のためにこれに答えてくれることを願っています。
Rapidminer は相関行列でどのような方法論を使用していますか? すべてのデータの組み合わせはいいのですが、最も重要なのは、名義/カテゴリデータセットの場合ですか?
私は Rapidminer を使用して相関行列を構築しており、すべての属性を数値、二項、多項式などとして適切にラベル付けするように注意しています。属性の名義/名義の組み合わせの一部について、行列が負の相関を示していることがわかりました。これを計算するために、通常は選択されると思われる方法 (ファイ、クラマーの V、コンティンジェンシー係数) に基づいているため、作成する必要はありません。これらのテストでは、相関関係が正でなければならないと考えました。データの順序を示唆するため、性別や都市などのカテゴリ間に「負の」相関関係があることは意味がありません。
使用されている別のテスト、またはダミーコーディングなどはありますか? また、ダミーコーディングを使用した場合、得られる値はどの程度信頼できますか?
私を助けることができる人に事前に感謝します。道に迷ったことを認めたくないのですが、ここでは地図が必要です :)