2

一部のデータのECDFをプロットする必要があります。私はそれを行うことができることがわかりました

ecdf = sm.distributions.ECDF(sample) 
x = np.linspace(min(sample), max(sample))
y = ecdf(x)
plt.step(x, y)

matplotlibおよびstatsmodelsPython パッケージを使用します。

私の問題は、変数sampleが約 1 GB のデータで構成されており、一度にすべてをメモリにロードできないことです。

小さなスライスにデータをロードしながら ECDF をプロットするにはどうすればよいですか?

4

0 に答える 0