多くの(たとえば100k)機能を使用してRで大規模な回帰(線形/ロジスティック)を実行したいと思います。各例は機能空間で比較的まばらです。たとえば、例ごとに最大1,000の非ゼロ機能があります。
SparseMパッケージslm
でこれを行う必要があるようですが、このsparseMatrix
形式から使いやすい形式に変換するのに問題がslm
あります。
y
ラベルとsparseMatrix
機能の数値ベクトルX
\in{0,1}があります。やってみると
model <- slm(y ~ X)
次のエラーが発生します。
Error in model.frame.default(formula = y ~ X) :
invalid type (S4) for variable 'X'
おそらく、の代わりにオブジェクトslm
が必要なためです。SparseM
sparseMatrix
SparseM
a)オブジェクトに直接データを入力する、またはb)asparseMatrix
をオブジェクトに変換する簡単な方法はありSparseM
ますか?それとも、これを行うためのより良い/より簡単な方法がありますか?
X
(とを使用して線形回帰のソリューションを明示的にコーディングできると思いますが、機能y
していると便利ですslm
。)