問題タブ [statistics-bootstrap]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - サンプルをブートストラップし、標準誤差 (SE) を生成する機能
ここに作成して表示した 4 つの一意の個人 (AAA:DDD) に関連付けられた 100 の確率があります。
個々の AAA:DDD の確率をブートストラップ (置換によるサンプル) したいと考えています。反復ごとに、0.50 カットオフを使用して確率を 0 と 1 に離散化し、ベクトルを合計します。
離散化して合計する以下の関数を作成しました。
for() ループ内の各個人の確率に関数を適用し、以下に示すように boot() 関数を使用したいと考えています。
for()
関数 BiSum は正しいと思いますが、ループと関数に誤って組み込まれていますboot()
。上記のループにより、次のエラーが発生します。
私の目標: 各個人 (AAA:DDD) について、Prob をブートストラップし、0.50 をカットオフとして離散化し、結果の 0 と 1 を合計します。これを AAA:DDD ごとに R=10 (たとえば低いだけですが、実際のデータでは R=10000 を繰り返します) 回実行し、boot()
オブジェクトの標準誤差を抽出します。
上記のループを改善する方法についての提案をいただければ幸いです。具体的には、「統計」引数をboot()
ループ内に正しく組み込む方法。
前もって感謝します。
confidence-interval - ブートストラップされた 95% 信頼区間の差に基づいて p 値を計算する
2.5 パーセンタイルと 97.5 パーセンタイルを使用して 95% の信頼区間を生成し、異なる 3 つのグループからいくつかのデータにモデルを適合させました。
95% 信頼区間が重ならない場合、少なくとも p<0.05 の値の間に有意差があることがわかっています。次のグループ間のペアワイズ比較の正確な p 値を計算したいと思います。
どんな助けでも大歓迎です!
r - データのサブセットからランダムに抽出し、R で統計テストをブートストラップする方法
2 つの変数を含むデータセットがあり、それらがブートストラップ ループで関連しているかどうかを統計的にテストしたいと考えています (つまり、Spearman のランク補正を使用してcor.test(...)
)。
私のデータセットの測定値のほとんどは、独立したサンプル単位 (単位を植物と呼びましょう) からのものですが、一部の測定値は同じ植物からのものです。疑似複製の問題に対処するために、テストの各実行で各プラントからの測定値を 1 つだけ使用して、統計テストを何度もブートストラップしたいと考えています。したがって、相関テストを実行する前に、プラントごとに 1 つの測定値をランダムに抽出するブートストラップ ループを作成する必要があります (その後、このプロセスを 99 回繰り返します)。
99 個のテストのそれぞれについて、p 値、rho、および S 統計を含む csv ファイルを作成したいと考えています。
サンプルデータ:
これまでのところ、複数の行で表される各植物の 1 つの行をランダムに描画することから始めて、統計テストを実行する前にこれらの値を残りのデータと組み合わせて、以下のコードをまとめました。ただし、統計テストを実行してサイクルを複数回実行するために、ブートストラップ関数 (boot()
または など) を組み込むのに苦労しています。bootstrap()
問題を解決するための迅速かつエレガントな方法があると確信しています。どんな援助でも大歓迎です!どうもありがとう。
r - R - いくつかの列基準によるブートストラップ
だから私が持っているのは、さまざまな年齢のタラの体重のデータです。このデータは、時間の経過とともにいくつかの場所で取得されます。
私が作成したいのは「年齢別体重」で、基本的には特定の年齢での体重の平均値です。毎年、場所ごとにこれを行いたいと思います。ただし、年齢は同じ方法でサンプリングされていないため (捕獲されたすべての古い魚が測定され、若い魚はサブサンプリングされます)、通常の平均を作成することはできません。サンプルをブートストラップしたいと思います。
ブートストラップは、年齢ごとの体重の 5 つのランダムな値を取り出し、平均値を作成して、これを 1000 回繰り返し、平均値の平均を作成する必要があります。値を再度使用できるようにする必要があります (置換)。これは、毎年、すべての AreaCode で年齢ごとに行う必要があります。依存要因: 年-場所-年齢。
これが私のデータがどのように見えるかの例です。
AreaCode にはさまざまな場所が含まれており、実際には 85 の異なるレベルがあります。時系列は 1991 年から 2013 年まで、0 歳から 15 歳までです。IndWgt には重みが含まれます。データ フレーム全体の行の長さは 185726 です。
また、すべての場所とすべての年にすべての年齢が存在するわけではありません。これが問題になるかどうかはわかりません。スクリプトが特定の行番号への参照に基づいていないためです。重みの列にいくつかの NA 値がありますが、事前に削除することができます。
replicate
、およびapply
または別のplyr
機能を使用する必要があるのではないかと考えていました。関数を理解しようとしましたが、 の下に引数を記述するかどうか、その場合はどのようにboot
記述するかはよくわかりません。statistics
ええ、基本的にはわかりません。
私が得ることができるどんな助けにも感謝します!
r - Rで行列にインデックスを付けるより高速な方法
何よりも、マトリックスを何度も何度もサブセット化/インデックス化する高速な(より)方法を探しています。
背景:
R でブートストラップを含む順次テスト手順を実装しています。いくつかのシミュレーション結果を再現したいので、多くのインデックス作成を行う必要があるこのボトルネックに遭遇しました。ブロック ブートストラップを実装するために、元のデータ マトリックスをサブセット化してデータのリサンプルを描画するインデックス マトリックスを作成しました。
一連のテスト手順を 1 回実行するのに約 10 秒かかります。これを 2500 回の複製といくつかのパラメーター コンスタレーションを使用したシミュレーションで使用すると、40 日ほどかかることになります。並列処理とより優れた CPU パワーを使用すると、より高速に実行できますが、それでもあまり満足のいくものではありません :/
- データを再サンプリングする/ループを取り除くより良い方法はありますか?
- 適用、ベクトル化、複製などはどこにでも入ることができますか?
- C でサブセット化を実装する (たとえば、いくつかのポインターを操作する) ことは理にかなっていますか?
すべてのステップは R によってすでに信じられないほど高速に実行されていますが、十分な速さではありません。
どんな種類の応答/ヘルプ/アドバイスも本当にうれしいです!
関連する Q:
- '[': 行ごと、列ごと、または関係ないことによる高速なマトリックスのサブセット化?
- R の行列形式でブートストラップ サンプルを生成するための高速関数
-ランダム サンプリング - 行列
そこから
本当に私のためにそれをしませんでした。
matlab - Matlab 2013 のブートストラップは、共分散行列と平均を計算します
以下、コードとエラーメッセージです。ブートストラップ共分散行列と平均を計算しようとしています。一貫した寸法が得られない理由は何ですか?
よろしく、
r - R は、ブートストラップを使用して標準誤差を計算します。 is.data.frame(x) のエラー:
次のプログラム コードを使用して、Libras Data Movement set のブートストラップを使用して標準誤差を推定しました。
しかし、次のエラーが発生しました:
問題を解決する方法を教えてください。前もって感謝します!