問題タブ [statistics-bootstrap]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
5290 参照

r - RまたはStataでのカテゴリ変数の比率のブートストラップ

R または Stata ソフトウェアでブートストラップを行う際に助けが必要です。政策の有効性などについて「はい」と「いいえ」と答えた人の割合を計算したい

Stataにはこのコードがあります

r(mean)割合を見積もるには、何の値が必要ですか?

また、Rには次のコードがあります。

コードを修正するにはどうすればよいですか? エラーが発生します

統計 (データ、オリジナル、...) のエラー: 未使用の引数 (オリジナル)

0 投票する
3 に答える
20376 参照

r - Rはブートストラップを使用して標準誤差を計算します

私はこの値の配列を持っています:

パッケージ ブートを使用して、データの標準誤差を計算したいと考えています。http://www.ats.ucla.edu/stat/r/faq/boot.htm

だから、私はこのコマンドを使って追求しました:

そして、私はこのエラーを受け取りました:

誰かが問題を解決するのを手伝ってくれますか? ありがとう

0 投票する
1 に答える
2348 参照

r - R: ブートストラップ混合モデル バイナリ ロジスティック回帰

混合モデルのバイナリ ロジスティック回帰をブートストラップする必要があります。モデル自体は正常に動作します (専門家の友人によって承認および修正されています) が、ブートストラップ バージョンにはバグがあります。ブートストラップされたバージョンは、以前に別の専門家の友人によって承認されていました (CrossValidated でしたが、後で mod が CrossValidated に属していないと言って私の投稿を削除しました)。しかし、同じコードがたまたま単純な固定効果多重ロジスティック回帰で機能しました (ただし、その場合も、ここでの警告と同様の警告がたくさんありました [lmer() 関数に対するこの単一の警告を除いて: "mer_finalize( ans) : 偽収束 (8)")。

エラーの場所とデバッグ方法を教えてください。

どうもありがとう。

私のコードは次のとおりです(一時的にレプリケート数を低くしてコードをデバッグできませんでした):

. . . 私のエラーは次のとおりです。

. . . また、boot() 関数に P 値も与える方法を教えてください??! ベータと SE、バイアスと CI が得られるだけですが、P 値も必要です。

どうもありがとう。

-------------------------------------------------- - 進行中の話 - - - - - - - - - - - - - - - - - - - - - - - - ------

わかりました Henrik の素敵なコードを喜んで実行しました。しかし、コードの実行はまだ完了していません。最初にこのエラーが発生しました:

次に、最初の括弧ブロックを削除し、構文を次のように修正しました。

今回は、テストは最初のステップ (モデルのフィッティング) に合格しましたが、P 値の取得に失敗し、同じエラーと警告が再び表示されました。

デバッグ方法がわからない、または問題がデータセットにあるのか? 私のデータセットは完全に平均中心 (すべての変数) であることを付け加えておきます。DV は否定されるだけです (平均センタリングは R の動作を許可せず、否定はバイナリ結果に対して同じことを行うため)。

-------------------------------------------------- - - - - アップデート - - - - - - - - - - - - - - - - - - - - - --------------------

METHOD の PB 値を LRT に変更し (Henrik が推奨したように)、モデルを適合させるプロセスは終了しましたが、P 値を取得するプロセスは開始されませんでした。

LRT を使用している場合、ブートストラップでは P 値が得られないことがわかりました。したがって、結果はすでに準備ができていました (ただし、ブートストラップされていません)。

0 投票する
2 に答える
5709 参照

r - R: 新しい lme4 パッケージの bootMer() を使用してブートストラップされたバイナリ混合モデルのロジスティック回帰

新しい lme4 パッケージ (現在の開発者バージョン) の新しい bootMer() 機能を使用したいと考えています。私は R を初めて使用し、その FUN 引数に対してどの関数を記述すればよいかわかりません。数値ベクトルが必要だと言っていますが、その関数が何を実行するのかわかりません。したがって、bootMer() にキャストされる混合モデル式があり、多数の複製があります。その外部関数が何をするのかわかりませんか?メソッドをブートストラップするためのテンプレートになるはずですか? bootMer にはブートストラップ メソッドが既に実装されていませんか? では、なぜ彼らは外部の「関心のある統計」を必要とするのでしょうか? そして、どの統計を使用すればよいでしょうか?

次の構文は適切ですか? R は、FUN が数値ベクトルでなければならないというエラーを生成し続けます。見積もりを「適合」から分離する方法がわかりません。そもそもそれを行う必要がありますか? その「楽しい」議論で迷っているとしか言えません。また、変数「Mixed5」を使用して混合モデルの glmer() 式を渡す必要があるのか​​ 、それともポインターと参照を渡す必要があるのか​​ わかりませんか?例を見ると、X (bootMer() の最初の引数は *lmer() オブジェクトです。*Mixed5 を書きたかったのですが、エラーが発生しました。

どうもありがとう。

私のコードは次のとおりです。

そしてエラー:

-------------------------------------------------- - - - アップデート - - - - - - - - - - - - - - - - - - - - - - ----------

ベンが指示したようにコードを編集しました。コードは非常にうまく実行されましたが、SE とバイアスはすべてゼロでした。また、この出力から P 値を抽出する方法を知っていますか (私には奇妙です)。afex パッケージの mixed() を使用する必要がありますか?

私の修正されたコード:

-------------------------------------------------- ------ アップデート 2 ------------------------------------------ -----------

次のことも試しましたが、コードは警告を生成し、結果は得られませんでした。

警告メッセージ:

-------------------------------------------------- ------ 更新 3 ------------------------------------------ -----------

このコードも警告を生成しました:

警告と結果:

0 投票する
1 に答える
1058 参照

r - 置換時にエラーを生成する boot() - R

ブートストラップされる lm オブジェクトから統計 (係数と p 値) を取得するための関数をいくつか作成しました。係数 1 が機能します。p値のものはエラーで失敗しています:

私は今、エラーが要因変数の包含に関連していると信じています。簡単に再現可能なデータを使用して問題を再現しようとします。

これらのそれぞれから返されるクラスの「数値」値は、私の初心者の目にはまったく同じ形式のように見えます...しかし、そうではないと思いますか? 次の関数を実行する前に、返された bt ブートストラップ オブジェクトもクリアしましたが、解決しませんでした。ブートストラップされた p 値を取得するにはどうすればよいですか? ご意見ありがとうございます。(Mac OSX で R 3.0.1 を実行しています。)

0 投票する
2 に答える
2095 参照

r - 置換長とデータまたはデータ型に関連する boot() のエラー? - R

boot() が 1 つのデータセットで失敗し、別のデータセットで成功しています ... データの問題でしょうか? 私は違いを理解することはできません。しかし、少なくとも今は再現可能だと思います。どちらの場合も、整数変数と因子変数の間の相互作用は、数値従属変数に回帰 (lm) されます。boot() コマンドが次のエラーで失敗しています:

p値を返す私の統計関数は次のとおりです。

ここで質問を再現して投稿するためにランダムデータを生成すると、次のようになります。

そしてブートストラップ:

ブートストラップは機能します。エラーなし; 統計が生成されます。しかし、同じタイプの私自身のデータ (以下) では、boot() はエラーを返します。

線形モデルは、これらのデータだけで正常に動作します。traceback() は、ブート呼び出し以外には何も生成しません。どうぞ、どんな考えでも大歓迎です。MAC OSX で R 3.0.1 を使用しています。そしてありがとうございました!

0 投票する
1 に答える
766 参照

matlab - matlab でのブートストラップ法によるリサンプリング

降水データセット (Matlab の sskt および kendall tau パッケージ) からブートストラップ サンプル (ランダム) を作成するためのスクリプトを作成しています。

データから 3 つの列を持つ 1 つの double 配列があります。

1 番目は年、2 番目はベクトル (季節または期間)、3 番目はこのステーションの降水量です (ベクトルはステーションの番号です。地域の傾向に対してこのメ​​ソッドを実行します)。

1970 1 234 1971 1 244 1972 1 344 ... ... ... 1970 2 342 1971 2 356 ... ... ...

など....各ステーションに36年あります(12ステーション= 12x36 = 3列の432データ)

データの N=5000 回の繰り返しに対して関数 sskt を呼び出すことができる 1 つの m スクリプト ファイルが必要です。私のデータはcsvファイルで、実際にはmatlabの二重行列です。5000回または1000回の繰り返しを生成する各列のブートストラップメソッドが必要です。1000回の繰り返しは、1000x36 = 36000回の繰り返しを意味します。1000 の最初のループで結果が得られたとき...このループで関数 sskt を呼び出し、結果として 1000 の S スロープ、1000 のケンドール タウ、1000 の符号があります。誰にもアイデアがありますか?

0 投票する
3 に答える
3975 参照

r - ビッグ データのグループごとの R ブートストラップ統計

グループを含むデータ セットをブートストラップしたいと考えています。簡単なシナリオは、単純な手段をブートストラップすることです:

incorrect number of subscripts on matrix一部のため、これによりエラーが発生しますby = "group"。サブセット化を使用してなんとか解決できましたが、この解決策は気に入りません。この種のタスクを機能させる簡単な方法はありますか?

特に、次のような統計関数に追加の引数を導入し、stat(x, i, groupvar)それを次のようなブート関数に渡したいと思いboot(data, stat(groupvar = group), R = 100)ます。

0 投票する
2 に答える
680 参照

r - R のカスタム ブートストラップ信頼区間

カスタム関数で取得した推定値のブートストラップ信頼区間を取得する方法を見つける必要があります。さて、問題は、ランダムに行を取り出して必要な量を計算する 1 つの大きな行列があることです。

これが(うまくいけば)再現可能な例です

同様のランダム データを生成します。

目的の数量を計算する関数 (R は相関行列):

ソリューションを試行する私の関数 (ここで、omat はいくつかの mat1 行で構成される小さな行列、freq は omat の行数、numR は反復数):

結果のベクトル b は、mat1 からランダムに選択された行 (freq によって決定される数) の行列から取得されたすべての値を持ち、omat からの IIvar (母集団メンバーシップによって選択された行を含む行列) と比較できます。

mat1 には、つまり 5 つの母集団 (行ごとにグループ化) があり、それらすべての IIvar を個別に計算し、取得した値の信頼区間を生成する必要があります。

このようにciint関数を実行すると

値の分布と「実際の」IIvar 値の位置を取得しますが、この時点から 95% 間隔を生成する方法がわかりません。

0 投票する
1 に答える
6078 参照

r - R - ブート ストラップ線形モデルによる R 2 乗と残差標準誤差の 95% 信頼区間の計算

私は R を初めて使用し、ブートストラップ法を使用して応答変数をリサンプリングし、回帰によって 999 個の線形モデルを作成することによって形成された R 二乗値と線形モデルの残差標準誤差の 95% 信頼区間を計算しようとしています。これらの 999 個のブートストラップされた応答変数は、元の説明変数に基づいています。

まず第一に、R-2 乗の 95% CI と ORIGINAL 線形モデル (ブートストラップ データなし) の残差標準誤差を計算する必要があるかどうかわかりません。はその線形モデルに対して 100% 正確であり、CI を計算しても意味がありません。

あれは正しいですか?

重要なのは、ブートストラップから作成した 999 個の線形モデルの R 二乗値と残差標準誤差値の CI を計算する方法がわかりません。