問題タブ [binning]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R ヘルプ: 間隔の決定、数値のビニング
以前に持っていた値のベクトル内の隣接する値の間に定義された間隔の間に、ランダムに生成されたいくつかの数値を「ビン化」しようとしています。したがって、本質的に、私は次のものを持っています:
vectorA
x と呼ばれる乱数を生成します。ここで、vectorA で互いに隣接する 2 つの数値の間のどの間隔に属しているかを確認したいと思いますか? 最後に、間隔が見つかったら、これら 2 つの値を返します。
if ステートメントが進行中です。if (x < vectorA[k] | x > vectorA[k+1])
、for ループの下で、if ステートメントが vectorA のすべてのインクリメントを通過できるようにします。
実際のビン間隔値を取得し、それらを使用して何かを計算する必要があるため、R の break メソッドから離れたいと思います。
python - 高速分類 (ビニング)
膨大な数のエントリがあり、すべてが浮動小数点数です。これらのデータx
には、反復子を使用してアクセスできます。10<y<=20
、、などの選択を使用してすべてのエントリを分類する必要があります。他のイテラブルからのデータは20<y<=50
どこにありますか。y
エントリー数は、セレクション数よりもはるかに多いです。最後に、次のような辞書が必要です。
または似たようなもの。たとえば、私はやっています:
一般的y
には多次元です。
これは非常に遅いです。numpy を使用するなど、より高速なソリューションはありますか? 問題は、list.append
私が使用している方法に起因するものであり、binner_function
matlab - MatLab-多くのエッジベクトルを持つhistc
このことを考慮 :
ここで、同じ出力を使用したいと思いますが、a
値ごとに異なる「エッジ」ベクトルを使用します。つまり、エッジのベクトルではなく行列を使用します。例:
ループを避けようとしているのでhistc
、ループの内側でこれを行うことができます。for
r - データフレームにカスタムビンを定義して適用する
Pythonを使用して、類似性の値を含む次のデータフレームを作成しました。
ビンを反映する別のデータフレームを生成するRスクリプトを作成しようとしていますが、値が0.5を超え、次のようになる場合、ビニングの条件が適用されます。
擬似コード:
上記のロジックに基づいて、データフレームを構築したい
これをスクリプトとして開始するにはどうすればよいですか、それともPythonでこれを実行する必要がありますか?Rがどれほど強力であるか、機械学習パッケージの数を調べた後、Rに慣れようとしています。私の目標は分類器を構築することですが、最初にRに精通している必要があります:)
plot - いくつかのデータを与えられたビンの数
ヒストグラムを使用していくつかのデータをプロットする必要があります。私のデータは[0,1]の間にあり、特定のポイントに大きな集中はありません。
サンプル数とビン数(同じ長さ)の適切な比率はどれくらいですか?
r - R均等化データをビニングする方法
こんにちは私はggplotでヒストグラムを描画しようとしていますが、私のデータにはすべての値がありませんが、値と出現回数があります。
値をビン化する方法、またはビン化された値のヒストグラムをプロットする方法のいずれかを知っている人は誰でもいます。
次のようなものを手に入れたい
python - Python:同じサイズのビンでヒストグラムを作成する方法
データセットがあり、そのヒストグラムを作成したいと思います。ビンは同じサイズである必要があります。つまり、等間隔のビンを持つというより一般的な(numpy.histogram)問題ではなく、同じ数のオブジェクトが含まれている必要があります。これは当然、ビンの幅を犠牲にして発生しますが、一般的には異なる可能性があります。
必要なビンの数とデータセットを指定して、代わりにビンのエッジを取得します。
したがって、ビンにはすべて2つのポイントが含まれますが、それらの幅(0.3、0.8、0.02)は異なります。
2つの制限があります。-データのグループが同一である場合、それらを含むビンは大きくなる可能性があります。-N個のデータがあり、M個のビンが要求された場合、N / M個のビンに加えてN%Mが0でない場合は1個のビンがあります。
このコードは、私が書いたいくつかのくだらないものであり、小さなデータセットでうまく機能しました。10 ** 9以上のポイントがあり、プロセスをスピードアップしたい場合はどうなりますか?
r - 数値変数をグループ/ビン/ブレークに分類
数値変数 (年齢) を間隔で定義されたグループに分類して、連続しないようにしようとしています。私はこのコードを持っています:
上記のコードはサバイバル パッケージでは機能しません。それは私に与えています:
エラーの場所を教えてもらえますか? data
私が使用しているデータフレームです。
matlab - matlabでムービーのサイズを変更する
2倍のビニングを実行した後、「ムービー」機能を使用して外部カメラからのライブビデオを表示しようとしています。私の元のビデオサイズは768x576です。ただし、ピクセルをビニングすると、元のビデオの半分のサイズに見える384x288の画像が表示されます。映画の表示サイズを元のサイズと同じになるように拡大する方法はありますか?言い換えれば、私のピクセルは2倍のサイズに見えます。
使ってみset(gca,'Position'...)
ましたが、ムービーのサイズは変わりません。
なにか提案を?
matlab - データを離散化するビニング手法
次のデータセットがあります。
1列目から6列目
バイナリ分割を使用して決定木を構築しようとしています。問題の 1 つは、データが継続しており、現在の実装では、データをそのままにして分割を行うことで計算量が多くなることです。1 つの分類子を作成するだけの場合、これは非常に悪いことだと言わざるを得ません。
私の場合、10 倍にして分類器を 5 から 50 に増やしています (バギング)。データがバケットに 0.2 バケットになるような方法でビニングを行うことを考えていましたが、負の数があることに気付きました。実装にはmatlabを使用しています。私はMatlab NewBであり、このようなシナリオを処理するための事前定義メソッドがあるかどうかはわかりません.