私はいくつかのタクシー データセットに取り組んでいます。pandas を使用して、すべてのデータセットを単一のデータフレームに連結しました。
私のデータフレームは次のようになります。
675 1039 #and rest 125 taxis
longitude latitude longitude latitude
date
2008-02-02 13:31:21 116.56359 40.06489 Nan Nan
2008-02-02 13:31:51 116.56486 40.06415 Nan Nan
2008-02-02 13:32:21 116.56855 40.06352 116.58243 39.6313
2008-02-02 13:32:51 116.57127 40.06324 Nan Nan
2008-02-02 13:33:21 116.57120 40.06328 116.55134 39.6313
2008-02-02 13:33:51 116.57121 40.06329 116.55126 39.6123
2008-02-02 13:34:21 Nan Nan 116.55134 39.5123
ここで、675,1039 はタクシー ID です。基本的に、緯度と経度を並べた合計 127 のタクシーがあります。
行の null 以外の値を抽出する方法はいくつかあります。
df.ix[k,df.columns[np.isnan(df.irow(0))!=1]]
(or)
df.irow(0)[np.isnan(df.irow(0))!=1]
(or)
df.irow(0)[np.where(df.irow(0)[df.columns].notnull())[0]]
上記のコマンドのいずれかが返されます。
675 longitude 116.56359
latitude 40.064890
4549 longitude 116.34642
latitude 39.96662
Name: 2008-02-02 13:31:21
ここで、最初の数行 (行 1 から行 6 まで) からすべての notnull 値を抽出したいと考えています。
それ、どうやったら出来るの?
私はおそらくそれをループすることができます。しかし、ループしない方法が必要です。
どんな助け、提案も大歓迎です。よろしくお願いします!:)