私は、5つの既知のグループを使用してユーザー分類に取り組んでいます(観察はグループにほぼ均等に分割されています)。私はこれらのユーザーに関する情報 (年齢、居住地域など) を持っており、各グループのユーザーを特定する特徴を見つけようとしています。
この目的のために、R の Rweka パッケージを使用します (機械学習アルゴリズムのコレクション: http://cran.r-project.org/web/packages/RWeka/RWeka.pdf )。私のグループを区別する特性を見つけるために、ロジスティック モデル ツリー (LMT) を使用します。この関数に関する情報はほとんどありません。
- プロットされた木の例をスケッチしてみます。分割は簡単に解釈できますが、各ターミナル ノードには次の情報が入ったボックスがあります。
LM_24: 48/96
(20742)
これは何を意味するのでしょうか?ノードが 5 つのグループのどのグループで終了するかを確認するにはどうすればよいですか?
- モデルで使用されている係数を取得するには、どの関数を使用しますか? 変数の影響を調べることができるように。
(これらのデータにツリーを構築するための他の方法を調べましたが、回帰ツリー パッケージと分類ツリー パッケージ (rpart、party など) の両方で、データ内のターミナル ノートが 1 つしか見つかりませんでしたが、LMT 関数では 6 つの分割ノードが見つかりました)
この機能に関する回答/ヘルプを提供していただければ幸いです。どうもありがとう!