問題タブ [binning]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
3 に答える
1808 参照

python - マトリックスをビン化する方法

numpy.histogram(data, bins) は、データ配列の要素が配列 bins によって定義されたビンにいくつ含まれるかを計算する非常に高速で効率的な方法です。次の問題を解決する同等の関数はありますか? R 行× C 列の行列があります。bins で指定された定義を使用して、マトリックスの各行をビンに入れたいと思います。結果は、R 行を持ち、列数がビンの数に等しい別の行列になるはずです。

入力として行列を与える関数 numpy.histogram(data, bins) を使用しようとしましたが、行列が R*C 要素の配列として扱われることがわかりました。次に、結果は Nbins 要素の配列になります。

0 投票する
1 に答える
617 参照

python - 配列をビンのいくつかのリストにデジタル化する

配列を numpy.digitize する必要がある状況があります。たとえば、コードは

これはうまくいきます。ただし、問題は、例のようなビンのリストが 1 つではなく、my_array の要素ごとに 1 つのビン リストがあることです (各要素が独自のビンを持つ異なるデータセットに属しているため) len(my_array) == len(list_of_my_bin_lists)。ここにありlist_of_my_bin_lists = [my_bin_list1, my_bin_list2, ...]ます。したがって、最初の配列要素については、その要素のどのビンにlist_of_my_bin_lists[0]属するか、2 番目の要素については、などをチェックする必要があることを digitize に伝える必要がありlist_of_my_bin_lists[1]ます。それは可能ですか?私は次のようなものを想像します

デジタル化のために返さなければならない: [0, 0, 2]

0 投票する
4 に答える
93 参照

c - 配列内のカウント合計を見つける

私はこのコードに数時間苦労しており、ガイダンスが必要です。500 個の数字のリストがあり、150 から 200 までの数字の数を取得する必要があります。

この時点で私は迷っています。150 < N < 200 のすべての値をカウントするカウンターを使用してプログラムをセットアップする方法を考えようとしています。これはこの問題を解決するための正しいアイデアだと思いますが、実装方法がわかりません。

0 投票する
1 に答える
126 参照

python - 値をビニングし、ビニング ラベルを使用して別のデータフレームのインデックスを参照する

私はこのタスクに苦労しています:
これまでに行ったこと:特定の間隔に従ってビニングした8760個の値があります。間隔の数は 10 です。次に、値をグループ化しました。

問題:このデータフレーム(df1)の各「レベル」を(df2)の別のデータフレームのインデックスに参照して、特定の計算を行単位で実行する必要があります(つまり、別のデータフレームの10個のインデックスを指す10個の間隔。

これを使用して、これを (df2) のインデックスに参照する必要があります。

必要な解決策: (-1, 0] はインデックス '1' を参照し、(0, 1] はインデックス '2' などを参照します。これは、すべての 8760 に対して (f11+f12+(f21*f22*f23)) を実行することです。参照されたインデックスに従って行単位の値。

0 投票する
1 に答える
2200 参照

python - Python での関数の値のビニング (numpy)

私の問題を公開させてください:

Python と Numpy を使用してソフトウェアを作成しました。X と Y という名前の 2 つの numpy 配列が生成されます。

この値は関数として関連付けられています: Y = f(X)

X 値は区間 [0;1] に属します。

numpy.histogram を使用すると、この間隔で定義済みの等間隔のビンに X 値をビニングできます。

私がやりたいのは、「for」ループを実行せずに、各ビンに対応する Y 値を合計することです。

ご回答ありがとうございます。

0 投票する
1 に答える
783 参照

r - stat_summary2d でビンを手動で指定する

座標 (x,y) と密度に似た数値 z 値で構成される大量のデータ セットがあります。データをビニングし、要約統計 (中央値、長さなど) を実行し、ビニングされた値を ggplot の美学にマッピングされた統計を使用してポイントとしてプロットすることに興味があります。

stat_summary2d を使用して結果を手動で抽出しようとしました (この回答に基づいて: https://stackoverflow.com/a/22013347/2832911 )。ただし、私が直面している問題は、ビンの配置がデータの範囲に基づいていることです。私の場合、データ セットによって異なります。したがって、2 つのプロット間で、ビンは同じ領域をカバーしていません。

私の質問は、stat_summary2d を使用してビンを手動で設定する方法、または少なくともデータに関係なく一貫性を保つように設定する方法です。

アプローチとビンが整列しない方法を示す基本的な例を次に示します。

生成するものこの画像

実際には、stat_summary2d を数回使用して、たとえば、ビン内のポイント数と中央値を取得してから を使用しますaes(size=bin.length, colour=bin.median)

私が提案したアプローチ、または別のアプローチを使用してこれを達成する方法に関するヒントは大歓迎です。