問題タブ [r-mice]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - マウスに代入関数を追加する
私は最近、R の潜在特性モデリング パッケージを使用して、段階的応答モデルをデータに適合させました。適合した段階的応答モデルをマウス パッケージに追加して、欠損データを補完しようとしましたが、編集するマウス アルゴリズムにアクセスできません。私の質問は、マウスで polr() 関数を使用する場合、またはこれらの関数は両方とも R の polr() 関数から派生しているため、潜在特性モデリング パッケージを使用して適合させた段階的応答モデルを使用してデータを代入する場合に違いがあるかどうかです。マスパッケージ
r - R マウス パッケージ: NA が 1 つしかない場合の 2l.norm のエラー
マウスを呼び出すときに「2l.norm」メソッドを指定した後、NA が 1 つしか含まれていない変数のエラー メッセージに出くわしました。これらの変数の欠落データが非常に少ないことを考えると、これは非常に小さな問題であることがわかります。ただし、これらのデータ構造も考慮に入れることはエレガントです。
すべての人がアクセスできるデータベースである ChickWeight データセットを使用して状況を再現しました。この問題は、手順の実装におけるエラーの結果である可能性があることも認識しているため、そのような場合はお知らせください.
最後のコマンドの結果は次のとおりです。
[<-.data.frame
( 、 、 i のエラー*tmp*
、値 = c(37.3233463394145、159.862324738397 : 置換は 2 行、データは 1 行)
NAを1つ追加すると、問題が解決します
誰がエラーの原因を知っていますか?
r - マウスからの帰属データのサブセットに対して glm.mids を実行します (R)
代入オブジェクトglm.mids
のサブセットで実行しようとすると、エラーが発生します。mids
不可解なエラーメッセージを表示します
glm
構文は元のデータセットの正規で機能しますが、次のようになります。
ドキュメント?glm.mids
には具体的には記載されていませんsubset
が、追加のパラメーターを に渡すことができると書かれていますglm
。subset
を使用できない場合、リスト オブジェクトを直接glm.mids
サブセット化する良い方法はありますか?mids
r - マウスの glm.mids からネストされたモデルを自動的に比較する
mice
多くの因子変数があるRのパッケージからの乗算帰属モデルがあります。例えば:
一度に 1 つの変数を削除するネストされたモデルごとに完全なモデルをテストすることにより、モデル内の各因子変数全体(各レベルの指標変数ではない)の有意性をテストしたいと考えています。手動で、私はできる:
モデル内のすべての因子変数に対してこれを自動的に行うにはどうすればよいですか? 以前の質問で非常に役立つ関数drop1
が提案されました。ケースを除いて、まさにそのようなことをしたいと思います。mice
おそらく役に立つメモ:の厄介な機能はpool.compare
、大きなモデルの「余分な」変数を、小さなモデルと共有される変数の後に配置するように見えることです。
r - R の MICE で各帰属データセットに対して操作を実行する
mids
R のパッケージのクラスのオブジェクトに含まれる各代入データセットに対して操作 (サブセット化や計算列の追加など) を実行するにはどうすればよいmice
ですか? mids
結果はまだオブジェクトでありたいと思います。
編集:例
帰属されたデータセットはリストのリストとして保存されます
指定された変数の代入を持つ観測のみの行があります。
元の (不完全な) データセットは次の場所に保存されます。
たとえばchl/2
、帰属データセットごとに計算された新しい変数を作成して、新しいmids
オブジェクトを生成するにはどうすればよいでしょうか?
r - マウスの pool() 関数と coxph(): mouse.df (...) 内: 大量のサンプルが想定されていますか?
乗算代入データセットでパッケージのcoxph()
関数を使用し、結果をプールしようとすると警告が発生しました。survival
警告メッセージには次のように記載されています。"In mice.df(m, lambda, dfcom, method) : Large sample assumed.
mice()
再現可能な例を以下に示します (公開されているデータを使用しcoxph()
、これらのデータを使用することの適切性についてあまり心配する必要はありません)。
この警告は、pool()
関数が dfcom を要求しようとしているために発生したようです。
wheredf.residual()
は、このコンテキストで参照されるオブジェクトには適用されません。coxph
私の質問は
- 目的に合わせて正しい構文を使用していますか?
- もしそうなら
pool()
、適切な情報を提供する方法はありますか? - この仮定は結果にどのように影響しますか?
r - マウスでの R シミュレーションと回帰()
私はRのマウスパッケージを使用して複数の代入を行い、その背後にあるアルゴリズムを理解しようとしています.
そのドキュメントhttp://www.jstatsoft.org/v45/i03/paperから、MICE アルゴリズムが使用されていると言われています。私の理解では、Gibbs Sampler を使用して MCMC を実行します。ここでは、Y-(Y を含まない他のすべての変数) を指定して、Y(欠損値のある変数) の条件付き分布を定義するパラメーター BETA をシミュレートします。シミュレートされた BETA を使用して、対応する条件付き分布が定義されます。次に、条件付き分布から値を引き出し、欠落をそれで置き換えます。値が欠落しているすべての変数に対して手順を繰り返します。
しかし、私が理解していないのは、回帰がどこで起こるのかということです. mouse() 関数では、'method' パラメータを指定する必要があります。たとえば、二項分布変数の場合は 'logreg'、2 水準以上の因子変数の場合は 'polyreg' です。代入が MCMC によって行われる場合、なぜ回帰を指定する必要があるのでしょうか?
一部のドキュメントでは、MICE アルゴリズムが、パターンが欠落しているすべての変数に対して反復的に回帰を実行することが示されています。毎回、欠落している 1 つの変数が回答者変数であり、その他はすべて説明変数です。次に、当てはめた値を使用して欠損値を置き換え、欠損値を持つ次の変数に進みます。次の回帰には、最後の回帰からの推定データが含まれます。これは Gibbs sampler と同じ方式ですが、シミュレーションはないようです。詳細はこちらhttp://www.ncbi.nlm.nih.gov/pmc/articles/PMC3074241/
Rのマウスで実際に何が起こっているのかを理解するのを手伝ってくれる人はいますか?
r - 「マウス」パッケージの predict() メソッド
パッケージのmice
関数を使用して代入戦略を作成したい。問題は、このパッケージに新しいデータのメソッド (またはいとこ) がmice
見つからないように見えることです。predict
私はこのようなことをしたい:
上記のコードをエミュレートするアプローチを見つけたいと思います。現在、トレーニングデータセットとテストmice
データセットに対して別々の操作を個別に実行することは完全に可能ですが、論理的な観点からは正しくないように思われます。すべての情報はトレーニングデータセットにあります。テストデータセットからの観測は、相互に情報を提供するべきではありません。これは、観測を出現時間順に並べることができるデータを扱う場合に特に当てはまります。
考えられるアプローチの 1 つは、テストデータセットから行を追加してデータセットを繰り返しトレーニングし、毎回代入を実行することです。しかし、これは非常に洗練されていないようです。
だからここに質問があります:
mice
一般的な方法に似たパッケージの方法はありpredict
ますか? そうでない場合、可能な回避策は何ですか?
ありがとうございました!