返された値ごとにパーセンタイル ランクを報告する必要がある R パッケージを開発しています。ただし、私が持っている分布は巨大です (〜 1,000 万の値)。
私が現在行っている方法は、関数を生成し、ecdf
その関数をファイルに保存し、必要に応じてパッケージで読み取ることです。保存したファイルが最終的に巨大 (~120 MB) になり、読み込みに時間がかかりすぎるため、これは問題があります。
f = ecdf(rnorm(10000000))
save(f, file='tmp.Rsav')
Rのパーセンタイルランクを概算することで、これをより効率的にする方法はありますか?
ありがとう