1

列の四分位数を計算しようとしています。ただし、私が使用したあらゆる種類の関数 (これまでのところ、numpy のパーセンタイルと pandas の分位数を最も近い、より高い、より低い、線形の補間で試しました)、常に不正確な四分位数を返します。こちらのリンクから確認しました。本当に正確な四分位数を返すことができる関数はありますか?それとも、正確にカウントする独自の関数を作成する方がよいでしょうか? 別の回答で見たので、誰かがここでカウントする独自の関数を作成しました

これは私のコラムQ1,Q3 = 200,650ですQ1,Q3 = 200,500。私が使用した補間が何であれ、常に不正確な結果があります。

cols = pd.DataFrame({'numbers':[100,300,200,400,500,6000,800,200,200]})
4

1 に答える 1

3

重複を削除した後、重複を削除しない場合、値はオフになりますquantile

s=pd.DataFrame({'numbers':[100,300,200,400,500,6000,800,200,200]})
s.drop_duplicates().quantile([0.25,0.75])
Out[13]: 
      numbers
0.25    250.0
0.75    650.0
于 2020-02-21T15:02:17.807 に答える