問題タブ [cumulative-frequency]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
sql - 日時のリストの累積頻度の SQL クエリ
データベース列に時間のリストがあります (Web サイトへの訪問を表します)。
それらを間隔でグループ化し、それらの日付の「累積頻度」テーブルを取得する必要があります。
たとえば、私は持っているかもしれません:
そして私はそれをに変換したい
どうやってやるの?SQLでこれを簡単に達成できますか? 私はC#でそれを非常に簡単に行うことができます
matplotlib - データポイントよりも少ないマーカーでプロットする(またはCDFをプロットするためのより良い方法?)[matplotlib、または一般的なプロットのヘルプ]
多数のデータポイントを使用して累積分布関数をプロットしています。同じプロットに数本の線をプロットしています。これらの線は白黒で印刷されるため、マーカーで識別されます。私が欲しいのは、x次元で等間隔に配置されたマーカーです。私が得ているのは、データポイントごとに1つのマーカーです(ポイントの数を考えると、それらはすべて重複しています)
うまくプロットする方法を理解しているのか、matplotlibを理解していないだけなのかはわかりません。「マーカー頻度」の設定が見つかりません。
1つの行の簡単な解決策は、その行からN番目ごとの値を取得し、それをlinestyle =''の別の行として使用することですが、マーカーを垂直方向に揃えたいので、x配列が異なると異なる長さ。
sql - SQL: 高速累積頻度クエリ (postgres)
データベースから累積頻度データを取得しようとしています。私たちが確認したすべての一意のステータス更新カウントと、その量のステータス更新を持つユーザーの数を含む単純な一時テーブルを作成しました。
私の現在のクエリは次のとおりです。
しかし、これにはかなりの時間がかかり、クエリの数は急速に増加します。したがって、私が持っている〜50,000行で、50,000の階乗行を読み取る必要があります。ここに座ってクエリがすり減るのを見ながら、まだ解決していないより良い解決策があることを願っています。
このようなものを得ることを望んで:
user-interface - ヒストグラムのビンの相対的な高さをインタラクティブに変更する
主観的な確率評価では、被験者の分布を引き出す必要があります。これは、被験者にヒストグラムの各周波数ビンの相対的な高さを操作させることで実現できます。つまり、確率分布では、累積和(P_i)=1を維持しながら包絡線が形成されます。これはRでどのように行うことができますか?構築できるパッケージはすでにありますか?
または、スプレッドシートアプリケーション(Excel、OO Calc、Googleスプレッドシート)でどのように実行できますか?
sql - SQLクエリ-累積比率を超える行を検索
次のようなデータのテーブルがあるとします。
つまり、合計20個のアイテムがあり、それぞれの累積比率はItemNo
100%になります。ここでは、テーブル行の順序が重要です。
ループやカーソルを使用せずにSQLクエリを実行して、累積比率を超える最初 のクエリを返すことはできますか?ItemNo
言い換えると、チェックしたい「比率」が35%の場合、ItemNo 3
0.15 + 0.10 + 0.15 = 0.40であるため、それを超える最初の行はです。
同様に、75%を超える最初の行を見つけたい場合、その行までItemNo 7
のすべての合計がProportion
0.75未満になるため、これはになります。
r - Rの同じグラフの頻度と累積頻度曲線
(R で ggplot などを使用して) 頻度曲線と累積頻度曲線を 1 つの列 (2 行) に描画する方法はありますか? 私はこれについて明確に願っています..
このデータを使用することができます..
r - R で累積パーセント頻度プロットのデータを処理する方法
パラメーターの値を持つクラスターの大規模なデータセットがあります。複数のクラスターが同じ値を持つことができます。
累積パーセンテージなしの累積パーセント度数分布プロットを作成したいと思います。y 軸にクラスターの数、x 軸にパラメーター値 (0 ~ 1 の範囲) を示します。
値に基づいてデータを並べ替えましたが、その後、R (ecdf) または matplotlib を使用して累積プロットを取得するためにデータを処理する方法がわかりません。どうすればこれにアプローチできますか?どんな助けでも大歓迎です。
私のデータは次のようになります
r - 累積度数と相対度数を使用してRで度数分布表を生成する方法
私はRを初めて使用します。累積度数と相対度数を使用して、(本のように)単純な度数分布表を生成する必要があります。
だから私は次のようないくつかの単純なデータから生成したい
次のようなテーブル:
シンプルなはずなのに、どうしたらいいのかわからない。
このコードを使用していくつかの結果が得られました:
arrays - perlの累積頻度配列?
整数の配列を取得しましたが、累積頻度配列をどのようにコーディングするのか疑問に思っていました。for ループを使用する必要がありますか、それとももっと簡単な方法がありますか。
たとえば、与えられた整数: 1 2 3 4 5 6 7 8 新しい配列は次のように出力されます: 1 3 6 10 15 21 28 36 ありがとう!
r - データフレームを累積頻度で効率的に置き換える
大きなデータ フレームを取得し、値の各列をそれらの値の累積頻度 (昇順で並べ替え) で置き換えるプログラムを作成しようとしています。たとえば、値の列が 5、8、3、5、4、3、8、5、5、1 の場合、相対度数と累積度数は次のようになります。
- 1: rel_freq=0.1、cum_freq = 0.1
- 3: rel_freq=0.2、cum_freq = 0.3
- 4: rel_freq=0.1、cum_freq = 0.4
- 5: rel_freq=0.4、cum_freq = 0.8
- 8: rel_freq=0.2、cum_freq = 1.0
元の列は次のようになります: 0.8、1.0、0.3、0.8、0.4、0.3、1.0、0.8、0.8、0.1
次のコードはこの操作を正しく実行しますが、おそらくネストされたループが原因でスケーリングが不十分です。このタスクをより効率的に実行する方法はありますか?