そこで、 reg_treeに出力するrpartを使用して回帰木を作成しました
# show summary statistics of reg_tree
summary(reg_tree)
# store top variables as new values
topvars <- reg_tree$variable.importance
# output of topvars
topvars
q_21fb1900 q_2b3296a0 q_0 q_fde6a01e q_7fa850ed q_323d6cee q_c6ab3657 q_eb2ad90d q_5dcb2b57
5.303283e+15 5.196871e+15 4.002239e+15 4.412505e+14 2.616730e+14 2.162128e+14 2.035465e+14 1.354927e+14 5.095959e+13
q_af2830be q_caa61b2c q_a6828865 q_99f5a0bd q_be83fe28 q_efdc29dd q_9e86aa7f q_2ea0e2aa q_5049294d
2.176437e+13 1.210118e+13 1.126591e+13 8.387189e+12 4.951978e+12 4.115929e+12 3.864235e+12 1.449853e+12 5.436949e+11
q_5ae0f0cd q_518fba14
5.436949e+11 5.412242e+11
これらの名前をそれぞれ xvar1、xvar2 として抽出し、各 xvar が列見出しに対応する次のモデルに自動的に配置したいと考えていますlm(y_var ~ xvar1 + xvar2 + xvar3 + ... +,data)
。
すなわち
lm(y_var ~ q_21fb1900 + q_2b3296a0 + q_0 + ... +,data)
新しいデータセットをドロップして、将来各 xvar をカスタム変更する心配がないようにするにはどうすればよいですか?