問題タブ [standard-deviation]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
bash - awk検索と標準偏差の異なる結果の計算
sarの出力を取得し、列の標準偏差を計算するように取り組んでいます。これは、ファイル内の1つの列で正常に実行できます。ただし、タイトル行や平均行などの「不良」行を削除しているファイルでこの同じ列を計算すると、異なる値が得られます。
これを実行しているファイルは次のとおりです。
/tmp/saru.tmp
/tmp/sarustriped.tmp
/tmp/saru.tmpに基づく計算:
/tmp/sarustriped.tmp(正しいもの)に基づく計算
誰かが助けて、これらの結果が異なる理由を教えてもらえますか?単一のawkコマンドで修正された結果を取得する方法はありますか?私はパフォーマンスのためにこれを行おうとしているので、grepや別のawkコマンドのような別のコマンドを使用しないことが望ましいです。
ありがとう!
アップデート
だから私はこれを試しました...
そして、それは私が使っていたsar-u出力に対して正しく機能します。他の「リスト」で機能しない理由がわかりません。簡単に言うと、sar -r列5を操作しようとすると、間違った答えが返されます...出力は1.68891を返しますが、実際の偏差は.107374です...これはsar-uを操作したのと同じコマンドです。 ....私が提供できるファイルが必要な場合。新しい「完全な」コメントを作成する方法がわからない...だから私は古いものを編集した...ありがとう!
bayesian - 標準偏差がゼロの確率密度関数
現在、NaiveBayesアルゴリズムを使用して電子メールフィルタリングアプリケーションを実装しています。私のアプリケーションは、UCI MachineLearningRepositoryのSpambaseデータセットを使用しています。属性は連続であるため、確率密度関数(PDF)を使用して確率を計算します。ただし、k分割交差検定を使用してデータを評価すると、トレーニングセットの属性の1つに0しか含まれない場合があります。このため、標準偏差が0になり、PDFがNaNを返し、そのトレーニングセットで大量のスパムが正しく分類されないことになります。問題を解決するにはどうすればよいですか?
cuda - CUDA を使用した標準偏差
それぞれ8000要素を持つ6つのベクトルの平均と標準偏差を見つけるコードを書いています。CUDAを使ってそれを実行し、動作を高速化できないかと考えていました。CUDAを使用して平均を見つける方法を考えることができましたが、CUDAを使用して標準偏差を計算する方法を理解できません。ここで誰か助けてくれませんか?
r - Barplot mean /w SD in R-Project
些細なことのように聞こえますが、いくつかの研究では洗練された解決策が得られませんでした: カテゴリ変数 (GROUP) と連続読み取り変数 (血圧) で構造化されたデータフレームがあります。各グループの平均と標準偏差を示す簡単な箱ひげ図を作成するにはどうすればよいですか? 複数のグループがあります: A、B、C、D データフレーム内で ANOVA 事後分析を実行するにはどうすればよいですか。Mann-Whitney-U-Test ではどのように機能しますか? 棒グラフで有意水準をマークできますか? この操作を複数の連続変数 (dia_bloodpressure、sys_bloodpressure、mean_bloodpressure) に効率化し、異なるファイルの出力を (変数の名前で) シンク() するにはどうすればよいですか?
statistics - BigQuery を使用して、標準偏差の結果と WHERE 句を組み合わせた外れ値を見つける
標準偏差分析は、外れ値を見つけるのに役立つ方法です。このクエリの結果を組み込む方法はありますか (平均から離れた 4 番目の標準偏差の値を見つける)...
結果 = 12.721342001626912
...平均から 4 標準偏差を超える体重で生まれた赤ちゃんが最も多い州と日付に関する情報を生成する別のクエリに変換しますか?
結果:
本質的に、これを 1 つのクエリに結合することは素晴らしいことです。
c# - 1 の標準偏差でコード化された逆 CDF を別の STDDEV に変換するにはどうすればよいですか?
逆累積分布関数 (CDF) を使用した数値積分のアルゴリズムの一部として、棄却サンプリングを行っています。
私は2つの可能な実装を見つけました:
- C と Java の場合 (およびその他。ただし C# ではないため、翻訳する必要があります):
http://home.online.no/~pjacklam/notes/invnorm/
- C# には、StatisticFormula.InverseNormalDistribution (System.Windows.Forms.DataVisualization.Charting 内) があります。何年も前に Microsoft が Excel で不適切な NORMINV を実装した実績があることを考えると、私は不安です。
これらの関数は両方とも、平均がゼロ (これから使用するもの) で、標準偏差が 1 であると想定しています。標準偏差が1と異なるように、この関数の入力および/または出力を変換するにはどうすればよいですか?
私はガウス分布で知っています:
f(x,mean,sd) = (1/(sd*sqrt(2*pi))) exp(-0.5 ((x-mean)/sd)^2)
したがって、g(x) = f(x,0,1) の場合、f(x,mean,sd) = (1/sd)*g(x/sd) となります。
Gaussian から別の Std Dev への変換は簡単です。逆CDFについても同様のことができますか?
parsing - 2番目の丸められたフィールドの重要性に基づく値フィールドのAwk丸め
次の入力をしたい
Average Box 1: 0.520522 Std. Dev. Box 1: 0.00297154
...特定の桁に丸められた最初の数値(平均)を出力します。この桁は、ROUNDEDstdの最初の有効桁によって定義されます。開発者
例->RoundedStd 0.003 <-(3桁目)
-> 0.521(この場合)
ボーダーケースを指定するには:
Average Box 1: 0.52156 Std. Dev. Box 1: 0.0099675
-> Rounded Std 0.01 <-(2桁目)
-> 0.52(この場合)
なんらかの方法でAwkの魔法を使ってこれをすべて行うことはできますか?もしそうなら、どのように?そうでない場合、私はそれを行うために何を使用できますか(私の最後の手段はCプログラムですが、シェルプログラムの方が効率的です)?
(これは、研究プロジェクト、別名/ nothomeworkでのデータ抽出用です。)
arrays - Matlab - デカルト ポイントの標準偏差
次のようなデカルト ポイントの配列があります (列 1 は x 値、列 2 は y 値)。
ポイントの標準偏差を取得するにはどうすればよいですか? それは、直線である平均と比較されます。ポイントはその直線ではないため、標準偏差は、線分が直線からどれだけ波打っているか、または「オフベース」であるかを表します。
本当に助かります。
r - ヒストグラムのビンごとの平均と標準偏差
R には、さまざまな時点でのマシンのさまざまな電力 (ワット) 値の頻度に関する R のヒストグラムを生成するコードがあります。
ヒストグラムは、「n」個のビンまたはセルに分割されます。
各ビンの平均値と標準偏差を計算する簡単な方法はありますか?
たとえば、
何か案は?
matlab - matlabでループなしでクラス内標準偏差を計算する方法は?
n*d 行列で表される n サンプル d 特徴を持つデータセットがあります。対応するラベルは *1 ベクトルです。matlabでループなしで各クラス内標準偏差を計算するにはどうすればよいですか?
例えば:
サンプル
ラベル:
クラス 1 とクラス 2 の標準偏差を計算するにはどうすればよいですか?