一部のデータのECDFをプロットする必要があります。私はそれを行うことができることがわかりました
ecdf = sm.distributions.ECDF(sample)
x = np.linspace(min(sample), max(sample))
y = ecdf(x)
plt.step(x, y)
matplotlib
およびstatsmodels
Python パッケージを使用します。
私の問題は、変数sample
が約 1 GB のデータで構成されており、一度にすべてをメモリにロードできないことです。
小さなスライスにデータをロードしながら ECDF をプロットするにはどうすればよいですか?