ライブラリを使用して、いくつかのデータをパレート分布scipy.stats
に適合させたいと考えています。問題が数値的なものであるかどうかはわかりませんので、安全のために; 独立変数 (「分」) の従属変数 (「プッシュ」と呼びましょう) の値を数千分で測定し、その後は 10 分ごとに測定しました (データクリーニング中に削除されたいくつかのポイントを除いて) )。
例えば
2780.0 362.0
2800.0 376.0
2810.0 393.0 ...
私が見つけることができる最高の情報は、次のようなものです
from scipy.stats import pareto
result = pareto.fit(data)
この場合、このデータをどのようにフォーマットするかわかりません。以下を試しましたが、すべてエラーになります。
result = pareto.fit(zip(minutes, pushes))
result = pareto.fit(pushes)
エラーは通常
Warning: invalid value encountered in double_scalars
いくつかのガイダンスをいただければ幸いです。ありがとうございます。