私は R にかなり慣れていないので、このサンプル データセットを分析して Naive Bayes 分類を開始しようとしていました。
Day Outlook Temperature Humidity Wind Play
1 Sunny Hot High Weak No
2 Sunny Hot High Strong No
3 Overcast Hot High Weak Yes
4 Rain Mild High Weak Yes
5 Rain Cool Normal Weak Yes
6 Rain Cool Normal Strong No
7 Overcast Cool Normal Strong Yes
8 Sunny Mild High Weak No
9 Sunny Cool Normal Weak Yes
10 Rain Mild Normal Weak Yes
11 Sunny Mild Normal Strong Yes
12 Overcast Mild High Strong Yes
13 Overcast Hot Normal Weak Yes
14 Rain Mild High Strong No
関数を使用して、table()
Outlook、Temperature、Humidity、Wind、Play などのカテゴリ変数の各値の出現回数を取得できました。次の段階に進むには、特定のターゲット クラスの値である Yes と No について、カテゴリ変数の各値の対応する出現回数を計算する必要があります。たとえば、X(outlook=Sunny,play= の出現回数を知るにはいいえ) 上記のデータセットの 2 です。目的の結果を得るには、どのコマンドを使用すればよいですか?
注: Naive Bayes で確率が計算されることはわかっていますが、この場合は頻度を取得することに関心があります。