“mean”の関連問題_Stack Overflow日本語サイト

0 投票する

4 に答える

19188 参照

r - グループ平均、合計、またはその他の要約統計を計算します。列を元のデータに割り当てます

グループ化変数 (「グループ」) の各レベル内の数値変数 (「値」) の計算(または、長さ 1のmeanその他の要約統計量)を計算したいと考えています。minmaxlengthsum

要約統計量は、元のデータと同じ長さの新しい変数に割り当てる必要があります。つまり、元のデータの各行には、現在のグループ値に対応する値が含まれている必要があります。データセットは、グループごとに 1 行に折りたたまれてはなりません。たとえば、 group を考えてみましょう:mean

前

後

2011-05-19T04:03:23.033

0 投票する

1 に答える

895 参照

python - numpyで多くの手段を実行する

おはようございます。Numpy で距離加重平均を行うための Cressman フィルターを実装しています。ボールツリーの実装 (Jake VanderPlas に感謝) を使用して、要求配列内の各ポイントの位置のリストを返します。クエリ配列 (q ) は形状 [n,3] であり、各ポイントにはポイントの x、y、z があります。ツリーに格納されているポイントの加重平均を実行したい.. ツリーにラップされたコードは、特定の距離内のポイントを返すので、可変長配列の配列を取得します。空でないエントリ (つまり、影響範囲内に少なくともいくつかの点があった位置) を検索する場所を使用して、isgood 配列を作成します...

次に、すべてのクエリポイントをループして、値 self.z の加重平均を返します (複数の共同グリッドを許可するために、これは dims=1 または dims=2 のいずれかであることに注意してください)。

したがって、マップまたは他のより迅速な方法を使用することを複雑にするのは、self.distances および self.locations 内の配列の長さの不均一性です...私はまだ numpy/python にかなり慣れていますが、その方法を考えることができませんこの配列ごと（つまり、ループに戻らない）

そう...ループを高速化する方法のヒントはありますか?..

距離、方位角、標高グリッドからデカルトグリッドへの気象レーダーデータのマッピングに適用される典型的なマッピングでは、240x240x34 ポイントと 4 つの変数があり、ツリーを照会するのに 99 秒かかります (C と cython で Jake によって記述されています。これはデータを検索する必要があるため、難しいステップです!) 計算を行うのに 100 秒かかります...私の意見では、どちらが遅いですか?? 私のオーバーヘッドはどこですか？np.mean は効率的ですか、それとも何百万回も呼び出されるため、ここで得られるスピードアップはありますか? default64ではなくfloat32を使用することで得られるでしょうか...またはintにスケーリングすることもできます(重み付けでラップアラウンドを回避するのは非常に困難です...ヒントを感謝して受け取りました!

python performance numpy interpolation mean

2011-06-03T15:23:56.903

0 投票する

1 に答える

562 参照

sql-server - SQL Server の標準偏差に MODE を使用する

MODE から 1.65 (90%) の標準偏差を使用してセットの外れ値を排除しようとしていますが、さまざまな理由から、ここでは説明しません。

これを行う良い方法はありますか？組み込みの STDVE() は MEAN を使用していると思います。これがカバーの下で何をしているのか知っている人はいますか?

前もってありがとう、ニック

sql-server mode mean outliers standard-deviation

2011-06-20T08:45:29.597

0 投票する

1 に答える

7246 参照

python - scipystatsの幾何平均はNaNを返します

scipyのgmean（）関数を使用して、電圧出力を含むnumpy配列の幾何平均を決定しています。数値の範囲は-80.0から30.0の間です。現在、numpy配列は2次元であり、2つの異なる測定の電圧を提供します。

ただし、幾何平均をとるとNaNが得られます。

誰かがこれを引き起こしているかもしれない考えを持っていますか？私は何か間違ったことをしていますか？

前もって感謝します！

python statistics numpy scipy mean

2011-07-17T19:42:40.010

0 投票する

2 に答える

394 参照

r - 大規模なデータセットの平均に基づいて合格/不合格の値を割り当てる

これは簡単な質問かもしれませんが、誰かが私を正しい方向に向けてくれることを望んでいました. 次のサンプルデータセットがあります。

列 J は、K で定義されている変数のタイプを指定します。隣に 1 が割り当てられている K 値の平均を取得できるようにしたいと考えています。この例では、10 と 17 になります。

次に、列 K の数値が平均より大きいかどうかを識別するために、合格 = 1、不合格 = 0 の合格/不合格ランクを割り当てられるようにしたいと考えています。

最終的なデータセットは次のようになります。

これはとても基本的なことのように思えます。申し訳ありませんが、自分が何を考えすぎているのかわかりません。

r conditional mean

2011-07-22T08:32:18.520

0 投票する

3 に答える

2536 参照

matlab - 4D画像データの平均値と最大値を計算するにはどうすればよいですか？

384 x 276 x 20 x 5の4D画像データがあります。ここdata(X,Y,T,V)でX = x location、、、、、。Y = y locationT = timeV = vessel location

データが信号のパターンを取得し、しきい値の値を設定するために、時間の経過に伴う平均値と時間の経過に伴う最大値が必要です。私はループでそれを行うので、たとえばdata(1,1,:,1)、時間の経過に伴うそのポイントの平均値を取得できます。

試しmean(data(X,Y,:,V))ましmean(squeeze(data(X,Y,:,V)))たが、「添え字インデックスは実数の正の整数または論理値である必要があります」というエラーが表示されます。

どこでも検索しますが、平均値の例は2Dと1Dのみです。時間の経過に伴うデータの平均/最大値を取得したい場合、データはdata(X,Y,:,V)3Dデータになります。

これを行う方法についてのヘルプやアイデアはありますか？

matlab multidimensional-array max mean

2011-07-22T13:37:20.857

0 投票する

2 に答える

1608 参照

r - データセットを複数回ランダムにサブセット化し、平均と分散を計算する

私はこの質問に関して結論に至らなかったので、言い換えてもう一度質問すると思いました。

データセットを 10,000 回サブサンプリングして、各応答の平均と 95% CI を生成したいと考えています。

以下は、データセットがどのように構成されているかの例です。

各研究/変数の組み合わせを 1 回だけサブサンプリングしたいと思います。たとえば、サブセット化されたデータセットは次のようになります。

行 3 と 6 がなくなっていることに注意してください。どちらも変数を 2 回測定したためです (最初のケースでは B、2 番目のケースでは A)。

サブサンプリングされたデータセットを何度も描画したいので、各変数の 95% CI で value1 と value2 の全体的な平均を導き出すことができます。したがって、サブサンプリングルーチン全体の後の出力は次のようになります。

サブセットを取得するために必要なコードを次に示します。

どんな助けでも大歓迎です。これは複雑だと認識していますので、説明が必要な場合はお知らせください。

r subset mean confidence-interval

2011-07-25T14:41:30.000

0 投票する

2 に答える

517 参照

subset - 増加するデータのサブセットをランダムに選択して、平均がどこで横ばいになるかを確認します

誰かが次のことを行うための最良の方法をアドバイスしてもらえますか?

3 つの変数 (X、Y、Z) と 4 つのグループ (1、2、3、4) があります。私は SPSS で判別関数分析を使用して、既知のグループ化されたデータのグループメンバーシップを予測し、将来のグループ化されていないデータで使用しています。

理想的には、データのサブセットの数を増やしてランダムにサンプリングし、目的の正しい分類パーセンテージに到達するために必要な観測数を確認できるようにしたいと考えています。

ただし、これが難しい場合があることは理解しています。したがって、私は手段のためにこれを行うことを検討しています。

たとえば、変数 X のグループ 1 の平均が 141 であるとします。この平均は、2000 の観測値から計算された可能性があります。ただし、平均が 700 回の観測で発生した場合もあります。私のデータの平均レベルがいくつの観察/ケースで計算できるようにしたいと考えています。たとえば、おそらく 10 回の観測から始めて、これをランダムに 50 回または 100 回繰り返し、その後 20 回の観測に増やします....などです。

これは一種のモンテカルロテストであることは理解しています。SPSS 15、17、18 と Excel にアクセスできます。minitab 15 & 16 と amos17 にもアクセスでき、「R」をダウンロードしましたが、これらに慣れていません。私の経験はSPSSとExcelです。私は SPSS Modified でいくつかの構文を試しました。

誰かが助けてくれることを願っています。

読んでくれてありがとう。

アンディ

subset montecarlo spss sampling mean

2011-08-04T12:17:44.873

0 投票する

3 に答える

3389 参照

c++ - ユーザー入力の幾何平均を求める

私はクラスのプロジェクトに取り組んでいますが、幾何平均の出力に問題があり、常に 1 になり、それは正しくないと確信しています。

これが私のコードです：

c++mean

2011-09-02T16:57:07.893

0 投票する

3 に答える

238 参照

c++ - 関数を介して配列を渡す

単純な配列を関数に渡して平均を計算しようとしています。

現在、コードは最後に入力された数値の平均のみを取っています。

c++arrays mean

2011-09-08T22:32:18.987

問題タブ [mean]

Reference