1

私は、5つの既知のグループを使用してユーザー分類に取り組んでいます(観察はグループにほぼ均等に分割されています)。私はこれらのユーザーに関する情報 (年齢、居住地域など) を持っており、各グループのユーザーを特定する特徴を見つけようとしています。

この目的のために、R の Rweka パッケージを使用します (機械学習アルゴリズムのコレクション: http://cran.r-project.org/web/packages/RWeka/RWeka.pdf )。私のグループを区別する特性を見つけるために、ロジスティック モデル ツリー (LMT) を使用します。この関数に関する情報はほとんどありません。

  1. プロットされた木の例をスケッチしてみます。分割は簡単に解釈できますが、各ターミナル ノードには次の情報が入ったボックスがあります。

LM_24: 48/96

(20742)

これは何を意味するのでしょうか?ノードが 5 つのグループのどのグループで終了するかを確認するにはどうすればよいですか?

  1. モデルで使用されている係数を取得するには、どの関数を使用しますか? 変数の影響を調べることができるように。

(これらのデータにツリーを構築するための他の方法を調べましたが、回帰ツリー パッケージと分類ツリー パッケージ (rpart、party など) の両方で、データ内のターミナル ノートが 1 つしか見つかりませんでしたが、LMT 関数では 6 つの分割ノードが見つかりました)

この機能に関する回答/ヘルプを提供していただければ幸いです。どうもありがとう!

4

0 に答える 0