問題タブ [statistics-bootstrap]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - nlsBootおよびforeach%dopar%:スコープの問題
nls
ループにフィットするために残差のブートストラップを実行したいと思います。私はを使用nlsBoot
し、計算時間を短縮するために、それを並行して実行したいと思います(現時点ではWindows 7システムで)。これが私の問題を再現するいくつかのコードです:
これは環境の問題だと思います。問題のコードを確認したところ、呼び出しnlsBoot
で無名関数を使用したことが原因のようです。lapply
nlsBoot
並列ループで使用する方法はありますか?または、関数を変更する必要がありますか?(for
代わりにループを使用することもできますlapply
。)
r - Rで分位点回帰にtexregを使用するときにse = bootを設定するには?
分位点回帰 (パッケージquantreg
) を実行texreg
しており、モデルのラテックス出力を作成するために使用しています。
ブートストラップされた se に興味があり、概要のオプションで se="boot" を設定しますが、texreg を使用すると "nid" se が表示されます
そのオプションを変更するにはどうすればよいですか?
これが私がやっていることです:
texreg を調べてみた (コンソールで texreg と入力) と、35 ~ 38 行目で見つけた
se メソッドを設定するにはどうすればよいですか? 私は R 関数を変更したことがありません。それが必要な場合は、その方法を説明するリンクを提案できますか?
sas - サブジェクトリストからブートストラップをブロックし、PROCMIXEDで係数を抽出します
から回帰係数の分布を取得するために、ブロックブートストラップ手法を効率的に実装しようとしていますPROC MIXED
。主な概要は次のとおりです。
私はパネルデータセットを持っています、例えばfirm
、そしてそれyear
はインデックスです。ブートストラップの反復ごとに、n個のサブジェクトを置き換えてサンプリングしたいと思います。このサンプルから、サンプリングされた各被験者のすべての観測値の「スタック」(行の上に連結された行)である新しいデータセットを構築する必要があります。この新しいデータセットを使用して、回帰を実行し、対象の係数を引き出すことができます。一連の反復、たとえば2000について繰り返します。
各企業は複数回選択される可能性があるため、各反復のデータセットにそのデータを複数回含める必要があります。ループとサブセットのアプローチを使用すると、計算が面倒になります。私の実際のデータセットは非常に大きい(2Gb .sas7bdatファイル)。
疑似/説明コードの例(すべてのnoobエラーをご容赦ください!):
この質問は、私が以前に尋ねた質問と同じです。ここにあります。
どんな助けでも大歓迎です!
r - Rの行列形式でブートストラップサンプルを生成するための高速関数
行列があり、の各列からサンプルを抽出して、新しい行列A
を作成したいと思います。A
例えば:
A = matrix(seq(1,9),3,3)
したがって、最初のブートストラップマトリックスを取得するには、の最初の列A
、つまり1,2,3から置換(3回)でサンプリングし、2番目の列(A
4,5,6 )から置換(3回)でサンプリングします。そして、の3番目の列A
、つまり7,8,9からの置換(3回)でサンプリングします。その後、3つのブートストラップベクトルを組み合わせて、最初のブートストラップ行列B1を再構築します。この手順をB=199回繰り返して、ブートストラップ行列B1、...、B199が使用できるようにします。
私の質問は、どうすればこのプログラムをより速く実行できるかということです。どの関数を使用すればよいですか?私apply
は本質的にfor
ループを含むことを知っているので、速度は保証されません。どうdo.call
ですか?ありがとう!
r - ブートストラップ統計の値
ブートストラップ統計の値(元の値、バイアス、エラー)を別のリストに入れたいのですが、その方法がわかりません。
次に例を示します。
ここで、テキストの代わりに実際の値が必要です。どうやらdata$t0
「オリジナル」ですが、バイアスとエラーの値を取得する方法がわかりません。
また、関数名を入力するとそのコードが得られるのでboost
、Rと入力してソースコードからスニペットをコピーし、ローカルのRインストールで検索しようとしました。しかし、何も見つかりませんでした。なぜ、Rはローカルストレージからそのソースコードを取得するべきではないのですか?
r - R のブートストラップ カバレッジ
真の平均が895.0385
. ベクトルがb<-c(300,300,200,250,600...)
あり、ブートストラップと出力間隔を作成します。
しかし、カバレッジ確率 (真の平均が何回含まれているか) を取得するために、これをどのように複製できますか?
r - 階層/マルチレベルデータのブートストラップ(クラスターのリサンプリング)
cats
データセット(-MASS-
パッケージから)からブートストラップサンプルを作成するためのスクリプトを作成しています。
Davidson and Hinkleyの教科書[1]に従って、単純な線形回帰を実行し、iid観測からのブートストラップ、つまりペアのリサンプリングに基本的なノンパラメトリック手法を採用しました。
元のサンプルは次の形式です。
単変量線形モデルを通じて、猫の炉床重量を脳重量で説明したいと思います。
コードは次のとおりです。
ここで、クラスタリング変数が存在するとしますcluster = 1, 2,..., 24
(たとえば、各猫は特定の同腹子に属しています)。簡単にするために、データのバランスが取れていると仮定します。クラスターごとに6つの観測値があります。したがって、24匹の同腹子のそれぞれは、6匹の猫(すなわちn_cluster = 6
、n = 144
)で構成されています。
次の方法で偽のcluster
変数を作成できます。
関連する質問が2つあります。
(クラスター化された)データセット構造に従ってサンプルをシミュレートする方法は?つまり、クラスターレベルでリサンプリングする方法は?置換を使用してクラスターをサンプリングし、選択した各クラスター内の観測値を元のデータセットと同じように設定します(つまり、クラスターを置換してサンプリングし、各クラスター内の観測値を置換せずにサンプリングします)。
これは、Davidson(p。100)によって提案された戦略です。B = 100
サンプルを描画するとします。それらのそれぞれは、24のおそらく再発するクラスター(たとえばcluster = 3, 3, 1, 4, 12, 11, 12, 5, 6, 8, 17, 19, 10, 9, 7, 7, 16, 18, 24, 23, 11, 15, 20, 1
)で構成されている必要があり、各クラスターには、元のデータセットの同じ6つの観測値が含まれている必要があります。でそれを行う方法はR
?(パッケージの有無にかかわらず-boot-
。)続行するための代替案はありますか?
2番目の質問は、初期回帰モデルに関するものです。クラスターレベルの切片を使用した固定効果モデルを採用するとします。採用したリサンプリング手順は変わりますか?
[1] Davidson、AC、Hinkley、DV(1997)。ブートストラップ法とその応用。ケンブリッジ大学出版局。
matlab - BOOTSTRAP 後にリサンプリングされたデータを表示する方法
次のように、Matlab で「ブートストラップ」を使用してデータベースを (置き換えて) リサンプリングしようとしていました。
上記のスクリプトは正しいですが、ブートストラップによって作成されたリサンプリングされた 100 個のデータセットをどのように表示/ロードできるのでしょうか? 'bootsam(:)' は、ブートストラップ サンプル用に選択されたデータ/値のインデックスを表示しますが、新しいサンプル値は表示しません!! 元のデータから偽のデータを作成していて、その裏で何が作成されているかさえ見えないのはおかしいではないですか!?
私の 2 番目の質問: 関数を使用せずに、マトリックス全体 (この場合は D) を完全にリサンプリングすることは可能ですか? ただし、「unidrnd」を使用してベクター データからランダムな値を作成する方法は知っています。
よろしくお願いします。
r - 負の二項式からの最初の差分ブートストラップ
ここの初心者。Y がイベント数、D が治療、X が対数オフセットであるカウント データに負の二項モデルを当てはめています。
D=1 と D=0 の最初の差の信頼区間をブートストラップしたいと思います。私はここまでやってきましたが、それが正しいアプローチであるかどうかはわかりません:
これは最初の違いをブートストラップする正しい方法ですか?
r - Rを使用してグループ(マルチレベル)を効率的にブートストラップする方法
私は40人の個人を含み、それぞれが10ビネットを評価している研究を分析しています。
ブートストラップを取りたかったのですが、ビネットをサンプリングするのは意味がないことにすぐに気付きました。代わりに人をサンプリングする必要があります(したがって、1人あたり約10行をサンプリングします)。
次の関数は機能しますが、次の関数のボトルネックのようなものです。問題は、どうすればこれをより効率的に行うことができるかということです。
サブセットの問題は、重複を保持する方法が見つからなかったことです。