データ セットには、調査の 21 の異なるセクションの開始時刻と終了時刻があります。各調査の終了時間と開始時間の差を計算し、そのデータを調査固有の列に入れたいと考えています。
開始時間と終了時間は HH:MM:SS です
これが私の実装でした:
def getSec(s):
l = s.split(':')
return int(l[0]) * 3600 + int(l[1]) * 60 + int(l[2])
...csvをdataFrameにインポートした後、私は
timeDifferences = {}
sections =['1','2','3','4','5','6','7_1','7_2','7_3','8_1','8_2','8_3','9_1','9_2','9_3','11_1','11_2','12','15','16','17','18_1','18_2','19','21']
for i in sections:
timeDifferences["s"+i+"_time"] = (getSec(df["s"+i+"_etimestamp"]) - getSec(df["s"+i+"_stimestamp"]))* 60
問題は、個々のデータセットではなく、シリーズ全体で getSec を実行していることです。私は Pandas を初めて使用するので、アレイ全体を同時に処理する方法を概念化できません。
ネストされた 3 つの for ループなしでこれを行うにはどうすればよいでしょうか?