列の 1 つにいくつかの nan/inf 値を持つ大きなデータ フレームの列をサブセット化しようとしています。
私は例えばこのようなものを試しました。
df = df[df['a'] == 'NaN']
または
df = df[df['a'] == 'Inf']
列内でこれらのタイプの値を参照するにはどうすればよいですか?
NaN は特別な値です。それは、それ自身でさえも、何にも等しいものではありません。NaN でフィルタリングする 1 つの方法を次に示します。
import math
df = df[df['a'].apply(lambda x: math.isnan(x))]
Inf は少し簡単です:
df = df[df['a'] == float('inf')]
あなたはそれが辞書であることを知っているので、理解を使用することはできませんが、反復することはできます:
subset = {}
for d in df:
if d['a']=='Nan':
subset.update(d)
print subset