通常分布し、pdf を当てはめたデータがいくつかあります。ただし、データセットから特定の値が発生する可能性の確率を取得したいと考えています。私の理解では、これは x の値が存在する pdf の下のビンの領域です。これを生成する numpy または scipy.stats 関数はありますか? 私は見ましたが、私はそれを見ていないか、私の理解不足が私を妨げています. これまでのところ、私は持っています:
import h5py
import numpy as np
from matplotlib import pyplot as plt
import matplotlib.mlab as mlab
import scipy.stats as stats
import numpy
import math
a = 'data.h5'
f = h5py.File(a,'r')
dset = f['/DATA/DATA/']
values = dset[...,0]
次に、このデータのヒストグラムを生成し、それに pdf を当てはめることができます。
n, bins, patches = plt.hist(values, 50, normed=1)
mu = np.mean(values)
sigma = np.std(values)
plt.plot(bins, mlab.normpdf(bins, mu, sigma))
plt.show()
そして、x の特定の値 (この場合は 0.65) の f(x) を取得できます。
print(stats.norm.pdf(0.65, np.mean(mb1), np.std(mb1)))
誰かがこれから私の確率を生成するのを手伝ってくれますか?
出力されたヒストグラムをpdfで添付しました。