多くの(たとえば100k)機能を使用してRで大規模な回帰(線形/ロジスティック)を実行したいと思います。各例は機能空間で比較的まばらです。たとえば、例ごとに最大1,000の非ゼロ機能があります。
SparseMパッケージslmでこれを行う必要があるようですが、このsparseMatrix形式から使いやすい形式に変換するのに問題がslmあります。
yラベルとsparseMatrix機能の数値ベクトルX\in{0,1}があります。やってみると
model <- slm(y ~ X)
次のエラーが発生します。
Error in model.frame.default(formula = y ~ X) :
invalid type (S4) for variable 'X'
おそらく、の代わりにオブジェクトslmが必要なためです。SparseMsparseMatrix
SparseMa)オブジェクトに直接データを入力する、またはb)asparseMatrixをオブジェクトに変換する簡単な方法はありSparseMますか?それとも、これを行うためのより良い/より簡単な方法がありますか?
X(とを使用して線形回帰のソリューションを明示的にコーディングできると思いますが、機能yしていると便利ですslm。)