問題タブ [binning]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Python-リストのビニングインデックスを生成する方法は?
私は10個のビンを持っています:
25個の値のリストがあります。
各値がそのビンにグループ化されるように、値を順番にビンにビニングしたいと思います。
binnedValues = [[10,0],[0,14,14],[123,235],[0,0,0],[0,0],[12,12,1235],[23,234],[15,15,23],[136,34,34],[37,45]]
ご覧のとおり、ビン内の値の数は必ずしも同じではありません(としてlen(values) != len(bins)
)
また、サイズの異なるさまざまな値のリストがたくさんあります。したがって、同じ数のビンに対してこれを何度も実行する必要がありますが、値リストの長さは異なります。上記は例です-実際のビンサイズは10kで、実際のlen(values)は〜10kから〜750kです。
これを一貫して行う方法はありますか?値の順序を維持する必要がありますが、値リストを均等に分割して、各ビンに分散される値の範囲の「公平」と「偶数」の数が存在するようにします。
numpy.digitizeを使用できると思いますが、見てみると、「ビニングされた」リストを生成する方法がわかりません。
python - Python の配列からの 2D および 3D 散布ヒストグラム
3 つの配列をヒストグラムにビン化する方法を教えてください。私の配列は次のようになります
1D プロットは次のようになります。
2D プロットは (定性的に) 次のようになります。
そのため、1 つまたは 2 つのフィールドを python/numpy でビン化し、それらをプロットしてそれらの対応を分析したいと考えています。
plot - gnuplotの頻度で作成されたヒストグラムに関数を当てはめる
イントロ
gnuplotには、いいねという名前のファイルからヒストグラムを作成するソリューションがありhist.dat
ます
コマンドを使用して
これは、他のSOページからこのようなヒストグラムを生成します。
質問
関数をこのヒストグラムに合わせるにはどうすればよいですか?ガウス関数を定義し、その値を次のように初期化しました。
出力では、関数はヒストグラムによく従っています。
残念ながら、コマンドを使用してこのヒストグラムに適合させることはできません
では、ビン化された値を含む新しいファイルを作成せずに、関数をどのように適合させることができますか?
matlab - Matlabでの巨大なポイントクラウドのビニングと平均化
私は巨大な3D点群[3x40e6]を持っています。平面の点群なので、そういう意味では2.5Dに似ています。ポイントクラウドを固定メッシュ範囲にビニングして、2Dマトリックスに配置し、imagesc(mymap)で表示できるようにします。
私はこの問題を解決しましたが、時間がかかりすぎます。これは私がこれまでに得たものです。正常に動作しますが、10分かかります。それはあらゆる種類のジャイブを補間します、そして私はそれを必要としません。
私が本当にやりたいのは、[3xN]ベクトルからのすべてのデータを特定の2D範囲マップにビン化することです。私はすべての値をそのマップにビニングする必要があると思います(いくつかの優れた高速ビニングアルゴリズムがあります)が、各ビンで平均したいので、そこに特定のZ座標スカラーも必要です。
ありがとう!
python - パンダのより良いビニング
データフレームがあり、値の範囲でフィルタリングまたはビン化してから、各ビンの値のカウントを取得したいと思います。
現在、私はこれを行っています:
しかし、同じことを達成するためのより簡潔な方法はありますか?
numpy - 2D 配列の Numpy リビニング
2D numpy 配列の数値ビニングを行うための高速な定式化を探しています。ビニングとは、サブマトリックスの平均または累積値を計算することを意味します。例のために。x = numpy.arange(16).reshape(4, 4) は、それぞれ 2x2 の 4 つのサブマトリックスに分割され、numpy.array([[2.5,4.5],[10.5,12.5]]) (2.5=numpy) が得られます。 average([0,1,4,5]) など...
このような操作を効率的に実行する方法...これを実行する方法がまったくわかりません...
どうもありがとう...
python - Python: 値が属するビンの確認
値のリストとビンのエッジのリストがあります。ここで、すべての値がどのビンに属しているかを確認する必要があります。次のように、値を反復してからビンを反復し、値が現在のビンに属しているかどうかを確認するよりも、Pythonic な方法はありますか。
これは私にはあまりきれいに見えません。ありがとう!
r - (x,y) でデータをビン化し、集計する
これらは私が持っている巨大なファイルの最初の 10 行です: (これらの 10 行には 1 人のユーザーしかいませんが、何千ものユーザーがいることに注意してください)
理解を簡単にするために、データが何であるかについて少し説明します。x と y は、緯度と経度の座標の変換です。を使用して、x、y 位置をビンに離散化しましたcut
。ユーザーごとに最も訪問されたビンを取得したいので、を使用しますddply
。次のように:
取得:
今私がやりたいことは、前の計算から得られた、ユーザーごとに最も訪問されたビンの最初のデータセットから平均 x、y を計算することです。これを効率的に行う方法がわかりません。私のデータセットが非常に大きいことを考えると、いくつかのガイダンスをいただければ幸いです。ありがとう!
r - 二次複雑計算によるデータフレームのR2Dビニング
私は一般的にこのように見えるデータフレームを持っています
xとyは位置です。vxとvyは、2次元ベクトルのx、y値です。このデータフレームを取得し、x値とy値に基づいて「ビン」にしたいのですが、vxとvyで計算を実行します。この関数は、データセットに対して遅すぎるループを使用することを除いて、これを実行します。
このタイプの2Dビニングはループしない方法で可能ですか?
python - データセットに対する範囲の使用
一見単純な問題で問題が発生しています。X、Y、Z 形式の原子座標のリストがあります。numpy.linspace() を使用して、Z 座標から「ビン」のリストを作成しました。Z 座標は、ソート後のポイント間の差が小数または整数のみになるようなものです。「ビン」を移動し、「bin0」-「bin1」、「bin1-bin2」の範囲にある座標セットの X、Y、Z のみを追加したいと思います。基本的に、これは本当に悪い疑似コードでやりたいことです。「ビン」範囲として使用したい等間隔の数値が既にあります
おそらく単純なpythonソリューションがあることは知っていますが、範囲を操作するリスト内包表記についての私の理解は限られています。どんなヒントでも大歓迎です。
編集*「SSCCE」を追加しようとしました