問題タブ [statistics-bootstrap]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R で縦方向のデータセットをリサンプリングする
すべての個人の観測ごとに 1 つの行で構成される縦方向のデータセットがあります。各観測にはいくつかの測定値があり、一部は欠落している可能性があります。個人の観測数にはばらつきがあり、大量の脱落者がいます。ここにデータセットのセクションがあります
必要なのは、このデータセットからブートストラップ サンプルを生成することです。ここでは、個々のクラスターが保存されます。これにより、個人がサンプリングされた場合、その ID の観測セット全体がブートストラップ サンプルに入ります。もちろん、個人は複数回サンプリングされる可能性があります。その場合、再サンプリングされたデータを適切な回数入力し、理想的には、たとえば 10056.1、10056.2 などの変更された ID 番号を受け取る必要があります。
今のところ、私はできる限り力ずくで問題を解決しようとしていますが、これをすばやく行う方法について誰かがアイデアを持っている場合は、大いに感謝します.
編集:私が最終的に使用したもの
r - ブートストラップによる 2 つの乱数の選択
1020 サイズ測定のデータセットがあります。これらの 1020 の数字に基づいて新しいデータセットを作成する必要があります。数字をランダムに取り出して置換する必要があります。ただし、次の方法でこのランダム サンプリングを行う必要があります。
- 元のデータセットからランダムに 2 つの数値を取り出します。
- これら 2 つの乱数のうち、大きい方の数を選択します。
- この大きな数値を新しいデータセットに取得します。
- 手順 1 ~ 3 を繰り返して、1020 サイズの新しいデータセット (元のデータセットのように) を作成し、合計で 1020 サイズの新しいデータセットを 10000 個作成します。
ブートストラップ法を使用して元のデータセットからランダムに番号を選択することにより、元のデータセットに基づいて 10000 個の新しいデータセットを作成することができます。
しかし、上記のこのコマンドを使用して 2 つの乱数を取得し、大きい方を選択し、この大きい方を新しいデータセットに含める方法がわかりません。
それは次のようなものでしょうか?
そして、いくつかのコマンド(私にはわかりません)があり、ドットは2つのうちより大きな数を新しいデータセットに取得するためのものでしたか?
r - R: 複素数は boot() 関数と互換性がありません
ブートパッケージの機能が複素数でboot
機能しないことがわかりました。二変量行列の固有値を取得して、データをブートストラップしようとしています。固有値の問題は、しばしば複素数を返し、それによって ( ) エラーが発生することです。複素数を避ける方法はありますか?boot
ここに私のコードがあります、
以下は、必要な機能の一部です。
そして、ここに主な方法があります、
問題はy.boot
オブジェクト、特にこの行で発生します
最小固有値の取得が複雑な場合、boot
このエラーが返されます
それ以外の場合は問題ありません。さて、この 100 回のブートストラップが 1 回実行されれば安全ですが、これも実際には約 100 回ループします。そのため、これらのループで複雑な値が発生する可能性が高くなります。したがって、上記のエラーが再び発生します。
これらの複雑な値を回避する方法はありますか?
r - ロジスティック回帰モデルの CI のブートストラップ
タラバガニの成熟時のサイズを予測するために使用しているロジスティック回帰モデルがありますが、ブート パッケージを使用したブートストラップ用のコードの設定に問題があります。これは私が持っているものです:
カニの 50% が成熟するサイズに関心があるため、統計 CL=98.97 をブートストラップしたいと思いますが、関数を設定してその統計を指定する方法がわかりません。一般的なブートストラップ関数は言うまでもありません。私の 95% CI を取得するには、どんな助けでも大歓迎です! ありがとう!
simulation - Stata での段階的回帰のブートストラップ
Stata で段階的な回帰をブートストラップし、ブートストラップされた係数を抽出しようとしています。2 つの個別の ado ファイルがあります。sw_pbs はユーザーが使用するコマンドで、ヘルパー コマンド sw_pbs_simulator を呼び出します。
出力は、ブートストラップされた係数のデータ セットです。私の問題は、出力が最初の段階的回帰シミュレーションの結果に依存しているように見えることです。たとえば、独立変数 var1 var2 var3 var4 があり、最初のステップワイズ シミュレーションでモデルに var1 と var2 のみが含まれている場合、後続のモデルには var1 と var2 のみが表示されます。最初のシミュレーションに var1 var2 および var3 が含まれている場合、var1 var2 および var3 のみが後続のモデルに表示され、それらが有意であると想定されます (そうでない場合、それらの係数はドットとして表示されます)。
たとえば、誤った出力を以下に示します。変数 lweight、age、lbph、svi、gleason、および pgg45 は、最初のシミュレーションで表示されない場合は表示されません。
モデルに含まれていない係数が常にデータ セットにドットとして表示されるようにし、その後のシミュレーションが最初のシミュレーションに依存しているように見えないようにしたいと考えています。
r - ロジスティック回帰とブートストラップ
lrm
パッケージからを使用して、最初にロジスティック回帰を実行しようとしていますRMS
。私のモデルは では正常に動作しますが、 では動作しglm
ませんlrm
。
ISS1
とISS2
が削除された場合 、モデルは実行されますが、これら 2 つの変数では実行されません。エラーメッセージ:
lrm
ブートストラップを使用するパッケージvalidate
は (明らかに) でのみ動作するため、で実行する必要がありますlrm
。どんな助けでも大歓迎です。
r - 点の問題と線形判別分析への R の適用
線形判別分析でいくつかの演習を行っているときに発生する、コーディングに関する質問があります。アイリスデータを使用しています:
ご覧のとおり、虹彩の 1 列目と 2 列目を削除します。私がやりたいことは、線形判別分析を使用したこのデータのブートストラップです。ここに私のコードがあります:
これにより、使用したいインデックスが生成されます。1000 などの大きな数に注意してくださいB
。apply を使用したいのですが、次のコードが機能しないのはなぜですか?
ここで、Species、Petal.Length などはアイリスのデータです。for ループを使用すると、すべて正常に動作しますが、もちろん、このよりエレガントな方法で実装したいと考えています。
2 番目の質問は についてpoints
です。また、次のコードで行った推定平均も計算したかった
最後のプロットには、3 つのクラスの予想平均を含む 3 つの領域が表示されます。ただし、最初のプロットのみが表示されます。
ご協力ありがとうございました。