分析しようとしている統計計算からの航空会社のデータセットがあります。
変数 DepTime と ArrDelay (出発時刻と到着遅延) があります。出発時間の特定のチャンクによって到着遅延がどのように変化するかを分析しようとしています。私の目的は、到着の遅延を避けるためにチケットを予約する際に、どの時間帯を避けるべきかを見つけることです
私の理解 - 出発時刻が 1800 を超える到着遅延と出発時刻が 1900 を超える到着遅延の間の片側 t 検定が高い有意性を示す場合、1800 と 1900 の間のフライトを避ける必要があることを意味します。 (間違っている場合は訂正してください) )。このようなテストをすべての出発時間に実行したいと考えています。
**プログラミングとデータ サイエンスはまったくの初心者です。どんな助けでも大歓迎です。
データはこんな感じ。強調表示された列は、私が分析しているものです