問題タブ [kernel-density]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R の時間密度プロット
それぞれのタイムスタンプを使用して、現象の観測を不規則に測定しました。
ここで、これらの点を x 軸にプロットし、カーネル密度関数を適用して、さまざまな帯域幅を使用して時間密度を視覚的に調査できるようにします。以下の例では x 軸のラベル付けを使用していませんが、このような結果になるはずです。たとえば、特定の日 (1 月 1 日、1 月 5 日など) のラベルを付けたいと思います。
ただし、上記のように、測定ポイント自体がプロットに表示されることが重要です。
r - タイトルなどを使用して、同じグラフに異なる線パターンで 3 つの密度をプロットする
私はRに非常に慣れていないので、私の質問の基本的な性質を許してください。要するに、私はこれに答えるために多くの Google 検索を行ってきましたが、利用可能な基本的なガイドやフォーラムでの簡単な議論でさえ、私が持っているよりも多くの事前知識を前提としていることがわかりました。コーディング用語とは何か、およびそれらを変更するとプロットにとって何を意味するのか。
要するに、1 つのグラフに密度をプロットしたい 3 列のデータを含むタブ形式のテーブルがあります。線をさまざまなパターンにしたいと思います (点線、破線など、簡単に区別できるものは何でも構いません。監督者が色覚異常であるため、色を使用できません)。
データを読み取り、関心のある列にアクセスできるようにするコードがあります。
ここからどこへ行けばいいですか?
estimation - エパネチニコフ多変量密度
サイズ 1x5 のベクトルで構成されるデータがあり、それぞれが pikel: を表し、[x,y,r,g,b]
位置: 、です。はピクセルの色です: .x
y
0 <= x <= M
0 <= y <= N
r,g,b
0 <= r,g,b <= 255
多変量 Epanechnikov カーネルを使用して密度推定を推定したいと考えています。基本的にそれを行うには2つの方法があることを読みました:
- 乗算法 - 各次元のカーネルを計算し、それらを乗算します。
- ベクトルのノルムを計算し、その値のカーネルを計算します。
2 つの方法のそれぞれは、私のデータに対してどの程度正確に機能しますか? Epanechnikov カーネルが正規化された値> 1
またはに対して 0 を生成することを知って、正規化する必要があるのは何ですか< -1
?
私はC++でプログラミングしています。
r - kde2d密度比較
kde2d (Kernel density estimator).
同じ変数空間内の 2 つの異なるデータ セットに対して 2 つの異なる kde2d を計算していることについて質問があります。両方をfilled.contour2またはcontoursと比較すると、散布図の点の密度が低いセット(合計で10倍の点も少ない)は、等高線の値の密度が高いことがわかります。ポイント密度が高いセットほど密度等高線の値が高くなると予想していましたが、上記のようにそうではありません。それは、帯域幅 (h) の選択に関係している必要がありますか? equals h を使用していますが、変更しようとしましたが、結果はあまり変わりませんでした。私のエラーは何ですか?
例
r - Rdensity()関数のデルタ関数への収束
エッジケースでの Rdensity() 関数の動作に少し困惑しています...
シミュレートされたデータ セットに x=0 のポイントをどんどん追加するとします。私が期待しているのは、密度の推定値が x=0 でのデルタ関数に非常に迅速に収束することです (それが何を意味するかについては意図的に曖昧にしています...)。実際には、次の一連のプロットが示すように、適合は確かに狭くなりますが、非常にゆっくりとなります。
しかし、シミュレートされたデータにわずかなノイズを追加すると、動作が大幅に改善されます。
眠っている犬を寝かせるだけですか?または、density() の使用法について何か不足していますか?
r - プロットの各ポイントの高さの値
s1mというタイトルのデータフレームにタンパク質間相互作用のデータがあります。DB と AD の各ペアは相互作用を行い、それをプロットすることもできます。
データのプロットは次のようになります。
次に、このサイトで見つけたコードを使用して、塗りつぶされた等高線をプロットしました。
結果の画像(落書きを除く)が得られました:
私の質問: 元のデータ フレームのデータの各行s1m
に、等高線図の高さに対応する番号を付けて注釈を付ける必要があります (したがって、上の画像の落書き)。リスト z には探している値があると思いますが、よくわかりません。
最終的に、グループでタンパク質の相互作用を研究できるように、データが次のようになることを願っています。
python - 2D カーネル密度推定の統合
scipy.stats.gaussian_kdeを介して取得するポイントのx,y
分布があります。これは私のコードであり、出力がどのように見えるかです (データはここから取得できます):KDE
x,y
座標付きの赤い点には、(2D プロットのすべての点と同様に) 0 から 0.42 の間の (カーネルまたは)(x1, y1)
によって与えられる関連値があります。としましょう。f
KDE
f(x1, y1) = 0.08
が未満と評価される領域、つまりで与えられたf
積分限界で積分する必要があります。x
y
f
f(x1, y1)
f(x, y)<0.08
私が見たものは、数値積分によって関数python
と 1 次元配列の積分を実行できますが、2D 配列 (カーネル)で数値積分を実行できるものは見たことがありません。その特定の条件によって指定された領域も認識します(つまり、指定された値未満)f
f(x, y)
これはまったくできますか?
python - Pythonで密度ピークを取得する方法
このような密度プロットを作成しています matplotlib で密度プロットを作成する方法は? プロット上のいくつかのスポットに axvlines を作成するつもりですが、私の問題は、最高ピークの正確な x 値を知る必要があることです。
ループで見つけることができます:
この bb の後にピークの x 値がありますが、このループを実行する時間が長すぎます。現時点では約25秒かかり、将来的にはデータのサイズが大きくなります
これが重複していないことを願っていますが、少なくともこの問題に対する回答が見つかりませんでした。