問題タブ [anova]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - コレクション内のさまざまな要素を検出するための効率的なアルゴリズム
測定されたプロパティのいくつかの数値を持つ 5 つの要素 (AE) のセットがあるとします (たとえば、「心拍数」など、要素ごとにいくつかの観測値)。
まず、平均レベルに有意差があるかどうかを検出する必要があります。そこで、Apache Commons Math が提供する Statistical パッケージを使用して一方向ANOVAを実行します。これまでのところ問題はありません。違いが見つかったかどうかを示すブール値を取得しています。
第二に、違いが見つかった場合、他の要素とは異なる要素 (または複数の要素) を知る必要があります。要素が他の要素と異なるかどうかを知るために、要素の各ペア (A と B、A と C .... D と E) を比較して、対応のない t 検定を使用する予定です。したがって、この時点で、他の要素との大きな違いを示す要素のリストの情報を取得しています。たとえば、次のようになります。
しかし、その情報を使用して、どの要素が他の要素と異なるかを効率的に判断するための汎用アルゴリズムが必要です (この例では C ですが、複数の可能性があります)。
統計的な問題はさておき、問題は (一般的な用語で) 次のようになります。他は?」
グラフ理論が適用できる問題のようです。有用であれば、実装にJava言語を使用しています。
編集:要素は人であり、測定値はタスクを完了するのに必要な時間です。ある種の不正検出システムで、誰がタスクを完了するのに時間がかかりすぎているか、または時間がかかりすぎているかを検出する必要があります。
r - 不均衡なデータセットの2元配置分散分析
aov
不均衡なデータセットに適しています。ヘルプによると...provides a wrapper to lm for fitting linear models to balanced or unbalanced experimental designs
。しかし後でそれは言うaov is designed for balanced designs, and the results can be hard to interpret without balance
。
Rの不均衡なデータセットに対して2元配置分散分析を実行するにはどうすればよいですか?
タイプIとタイプIIIのSAS
出力の二乗和の異なる結果を再現したいと思います(を使用する場合proc glm
)。type III sum of squares
不均衡なデータセットに使用していたことを覚えています。
前もって感謝します。
r - 二元配置分散分析の[R]の検出力分析
2x2の因子計画に必要なサンプルサイズを計算しようとしています。2つの質問があります。
1)パッケージpwrと一元配置分散分析関数を使用して、次のコードを使用して必要なサンプルサイズを計算しています
ただし、一元配置分散分析よりもグループ平均の推定に効率的であるため、二元配置分散分析を検討したいと思います。私が見つけることができた双方向の分散分析関数はありません。これを行うためのパッケージまたはルーチンが[R]にありますか?
2)さらに、一元配置分散分析を使用しているため、サンプルサイズがより保守的(つまり大きく)になると想定しても安全ですか?
r - Two-Way ANOVA の等分散性検定
私は基本的な ANOVA の仮定、とりわけ等分散性 (均質性、分散の等式) をチェックするためにvar.test
およびを使用してきました。bartlett.test
一元配置分散分析の手順は非常に簡単です。
しかし、2x2 テーブル、つまり Two-Way ANOVA の場合、次のようなことをしたいと思います。
もちろん、ANOVA の仮定はグラフィカルな手順で確認できますが、「算術オプション」はどうでしょうか。それは、まったく管理可能ですか?Two-Way ANOVA で等分散性をどのようにテストしますか?
r - aov から p 値を抽出する
Rのanovaから生成されたp値を抽出しようとしています.
これが私が実行しているものです:
収量:
構造を見ると、これが見えます。私は通常、必要なものを取得するためにリストを操作できますが、これには苦労しています. Google で検索したところ、私が得ているよりもはるかに単純な構造が明らかになったようです。
注: ASQ は私のデータ フレームです。
python - Python で時間の経過に伴う ANOVA、私は何をしていますか?
私は統計学がとても好きですが、6 年以上コースを受講していません。ここで必要なテストの種類と、これらの種類の問題に使用するのに最適な numpy/scipy/R 関数を理解するのに苦労しています。
訪問者とそれに対応するプロパティ (例: "Browser = Mozilla, Referrer = Google") のテーブルと、時間の経過に伴うデータ ポイントにグループ化された、訪問者ごとの変数値 (例: $5) があります。
私の目標は次のとおりです。
A) 最も重要なプロパティ ファミリを見つけ、そのファミリが「どれほど重要か」のスコアを付けます
導きたい結論の例*:
と
B) 有意性スコアを使用して、ファミリー内で最も重要なプロパティを見つけます。
私が描きたい結論の例:
私の質問は次のとおりです。
1) ここで私の生活を楽にする numpy/scipy/R 関数はありますか?
2)ANOVA(分散分析)とANOVA-over-timeについてもう少し知っている人は、フィードバックを提供してもらえますか? 私はこれを正しくやっているとは確信が持てず、単純なものが欠けている可能性があります。確認または修正はどちらも大歓迎です。
これらは、過去 30 日間の (ヒット数、値、日数) の配列であることに注意してください。たとえば、月曜日に Value-Of-Mozilla に大きなピーク (ベースラインと比較して) があり、火曜日に Value-Of-Mozilla に (ベースラインを下回る) 低下がある場合、Mozilla を「重要な」プロパティとして表示したいと考えています。 (ピーク/ドロップが互いに相殺するのではなく)
マップ/縮小する前の入力データの例:
これが私の現在のコードです。これは Dumbo/Hadoop で実行され、基本的に私が考案した数式の「重要度」の数値を提供します。私の式は機能し、意味のあるデータが得られますが、「重要性」の値は明確に定義されていません (「重要な」プロパティのスコアは通常 100 以上ですが、これはデータセットのサイズによって異なります)。これにはおそらく「本当の公式」があります。
前もって感謝します!
normalization - 分散分析の前にスケーリングしますか?
発現差のある遺伝子を同定するための分散分析を行いたい。差次的に発現する遺伝子を探す前に、分位正規化または中央絶対偏差を使用してデータをスケーリングする必要がありますか、それともRMAを介して取得したデータに直接分散分析を適用する必要がありますか?
よろしくお願いします
r - 反復測定/被験者内ANOVAinR
Rを使用して反復測定ANOVAを実行しようとしています。さまざまなWebサイトでさまざまな例を調べましたが、発生したエラーについて話しているようには見えません。私は何か重要なことを誤解していると思います。
私が実行しようとしているANOVAは、人間の参加者を使用した実験からのいくつかのデータに基づいています。1つのDVと3つのIVがあります。すべてのIVのすべてのレベルがすべての参加者で実行され、3方向の反復測定/被験者内ANOVAになります。
Rで実行しているコードは次のとおりです。
これを実行すると、次の警告が表示されます。
私が間違っているかもしれないアイデアはありますか?
r - Rヘルプの一元配置分散分析
私は R (統計パケット) プログラミングが初めてで、1way anova を作成したいと考えています。
私のデータフレームはそのようなものです
私を手伝ってくれますか ?