どうすれば、離散データセットのスパークデータを「よりスムーズに」削除できますか?
たとえば、
20000 で 2 つのスパークがありますが、次の 600 でのスパークもスパークと見なされます。
非常に高いものをゼロにすることができました。
a = 2
b = 5
beta_dist = RealDistribution('beta', [a, b])
f(x) = x / 19968
normalized_insertions = [f(i) for i in insertions]
insertions_pairs = [(i, beta_dist.distribution_function(i)) for i in normalized_insertions]
plot_b = beta_dist.plot()
show(list_plot(insertions_pairs)+plot_b)
下位のものについてはどうすればよいかわかりません。最大値は 100 に到達する必要があります。おそらく、ベータ分布のパラメーターをもう少しいじる必要がありますか?
現在、次のようになっています。
可能であれば、説明の参考として sage を使用してください。