pandas データフレームに「loc」を使用するのはなぜですか? loc を使用して、または使用せずに、次のコードのように思われます。
%timeit df_user1 = df.loc[df.user_id=='5561']
100 loops, best of 3: 11.9 ms per loop
また
%timeit df_user1_noloc = df[df.user_id=='5561']
100 loops, best of 3: 12 ms per loop
では、なぜ loc を使用するのでしょうか。
編集:これは重複した質問としてフラグが立てられています。しかし、パンダ iloc 対 ix 対 loc の説明はありますか? それについて言及しています*
データ フレームのgetitemを使用するだけで、列の取得を行うことができます 。
*
df['time'] # equivalent to df.loc[:, 'time']
loc を使用する理由については述べていませんが、loc の多くの機能について説明していますが、私の具体的な質問は、「なぜ loc を完全に省略しないのか」ということです。以下の非常に詳細な回答を受け入れました。
また、他の投稿の回答(私は回答ではないと思います)は議論に非常に隠されているため、私が探していたものを探している人は情報を見つけるのが難しく、提供された回答によってはるかに役立つでしょう.私の質問に。