Boxplot をプロットし、四分位数と最小値と最大値でラベルを付けていました。いくつかの列ではうまくいきました。ただし、一部の列では、統計値が箱ひげ図の統計と正確に一致しませんでした。
たとえば、summary
コマンドは のmedian
値を与えていましたが2320
、boxplot.stats
は値を与えていました2319.5
。
私はStatlog (German Credit Data) Data Set
信用リスクのスコアリングに使用していました。
データセットのリンク: https://archive.ics.uci.edu/ml/datasets/statlog+(ドイツ語+クレジット+データ)