一部のデータのECDFをプロットする必要があります。私はそれを行うことができることがわかりました
ecdf = sm.distributions.ECDF(sample)
x = np.linspace(min(sample), max(sample))
y = ecdf(x)
plt.step(x, y)
matplotlibおよびstatsmodelsPython パッケージを使用します。
私の問題は、変数sampleが約 1 GB のデータで構成されており、一度にすべてをメモリにロードできないことです。
小さなスライスにデータをロードしながら ECDF をプロットするにはどうすればよいですか?