問題タブ [binning]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Pythonでリストをビニングする
まず第一に、私は Python の初心者であり、このコードは、stackoverflow に関するユーザーからのアドバイスや提案と共に作成されたものです。コードを以下に示します。
元のグラフは P と Mag の散布図です。ただし、期間ごとに複数の Mag ポイントがあります。これらすべての Y 値を取り、個々の X 値ごとに平均化できる新しい散布図を作成して、2 つのくぼみを持つよりタイトなグラフを作成したいと考えています。
データをビニングするさまざまな方法を調べてみましたが、どの方法を使用しても、ビニングされたデータを含むグラフが正しく表示されないようです。X 値は、事前にビニングされたデータ グラフのように 0 から 1 まで実行する必要があります。
これは、私が作業しているデータです。念のため、表示する必要があります。
ビニングされたデータグラフを作成する方法について、誰か提案やアドバイスを提供できますか? データ ビニングに関する私の知識はごくわずかです。
お時間をいただきありがとうございます!
python - X行ごとにパンダのデータフレームをビン化する
3行ごとにビン化したい単純なデータフレームがあります。
次のようになります。
そして、私はそれをこれに変えたいと思います:
私はすでに同様の質問をここに投稿しましたが、ソリューションを現在のユース ケースに移植する方法がわかりません。
あなたは私を助けることができます?
どうもありがとう!
r - Rで時系列をビニング?
私は R を初めて使用します。私のデータにはId
、と の 3 つの属性で定義された 600k オブジェクトがDate
ありTimeOfCall
ます。
TimeofCall
の00:00:00
形式と範囲は00:00:00
~23:59:59
です。
TimeOfCall
属性を 24 個のビンにビン化し、それぞれが 1 時間ごとのスロット (最初のビンなど)00:00:00
を表します00:59:59
。
誰かがこれを行う方法を教えてもらえますか? 使用してみcut()
ましたが、どうやら私の形式は数値ではありません。前もって感謝します!
r - ビニングされたデータを使用してRでキルトプロットを作成する方法は?
このウェブサイトのおかげで、気象観測所の降雨データを 1 km のグリッドに補間し、Rを使用してプロットするコードを書くことができました。コードの最後の部分で不要なデータが削除され、quilt.plot を使用してプロットされます。プロットされるデータ (mydf.final) は、次の見出しを持つ値のリストです: インデックス、東座標、北座標、降雨量、および平均降雨量。dput を実行すると、プロットされるデータのサンプルは次のようになります。
次を使用してこのデータをプロットできます。
評判ポイントが足りないので載せられない画像になってしまいました。エイミーウェイ、このプロットは、さまざまな色の降雨量を示す英国の地図で、最大降雨量が赤で最小降水量が青で示されています。
これでもかまいませんが、次の 2 つのことを行いたいと考えています。
プロットするすべての降雨データが 0 以上であることを確認してください。一部の降雨データは負の値 (例: -1) ですが、プロットする前にすべての負の値を 0 に変更するにはどうすればよいですか?
最小値と最大値 (青から赤) の間の色範囲を使用するのではなく、値をビニングしたいので、たとえば、青は 0mm から 5mm、水色は 5mm から 10mm、黄色は 10mm から 20mm、赤はそれより大きい30mmなど。これを達成する方法はありますか?
python - 別のリストのqcutに基づいてリストをビニングするパンダ
リストがあるとします:
および次のサブリスト:
pd.qcut(a,2)
リストbのビンを取得し、各ビンの値の数をカウントしたいと思います。あれは
これで、ビンが [1,3] と (3,8] であることがわかりました。リスト "b" の各ビンに含まれる値の数を知りたいと思います。ビンの数が小さいですが、ビンの数が多い場合の最善のアプローチは何ですか?
r - Rデータフレームで計算されたデータをパーセンタイルでビン化する方法
多数のシンボル、日付、および値を含むデータ フレームがあります。
データをシンボルで分割し、最新の 2 つの日付の変化率を計算し、最初のグループが最大の pct セットを持つ可変数のグループでデータをビンに入れたいと考えています。次は 2 番目に大きいなどです。各グループには、ほぼ同じ数のシンボルが必要です。
理想的には、新しいデータ フレームを次のようにしたい
これは ddply にとって完璧なタスクのように思えますが、何かを機能させるのに苦労しています。どんな提案でも大歓迎です。お時間をいただき、ありがとうございました。
r - datetime から前の 5 分ビンの時間間隔による平均化
似たような質問があるのはありがたいのですが、質問に対する正しい答えが見つからないようです。タイム スタンプに基づいて 5 分間隔で 1 つの列のデータを平均化したいデータ セットがあります。 09:56-10:00 になります。
これが私のデータセットの例です:
以下のコードを試してみましたが、思い通りに動作させることができませんでした。
これらは正しい平均ですが、タイムスタンプは 5 分間の最後ではなく最初のタイム スタンプであるため、R で指定された 12:01 は実際には 12:05 (12:01 から 12:05 までの期間) です。残念ながら、出力を のような形式にすることはできないようです12/07/2013 12:05 -19.91691
。
r - R data.frame でのビン形成
2 つの列を持つ data.frame があります。
2 つのパラメーターを持つ関数を作成する必要があります。dataframe
は、数量列を超えて実行され、超過した場合は後続の行を分割しbin_size
、実行中のビン番号を追加の列として追加します。cumsum
cumsum
bin_size
次のように入力します。
上記の例では、次のようになります。
説明: