0

列の 1 つにいくつかの nan/inf 値を持つ大きなデータ フレームの列をサブセット化しようとしています。

私は例えばこのようなものを試しました。

df = df[df['a'] == 'NaN']

または

df = df[df['a'] == 'Inf']

列内でこれらのタイプの値を参照するにはどうすればよいですか?

4

2 に答える 2

0

NaN は特別な値です。それは、それ自身でさえも、何にも等しいものではありません。NaN でフィルタリングする 1 つの方法を次に示します。

import math
df = df[df['a'].apply(lambda x: math.isnan(x))]

Inf は少し簡単です:

df = df[df['a'] == float('inf')]
于 2016-07-05T05:37:57.697 に答える
0

あなたはそれが辞書であることを知っているので、理解を使用することはできませんが、反復することはできます:

subset = {}

for d in df:
   if d['a']=='Nan':
         subset.update(d)

print subset
于 2016-07-04T00:48:49.987 に答える