PythonのRのNAに相当するものは何ですか?
具体的には、R には NaN、NA、NULL、Inf、および -Inf があります。NA は通常、欠損データがある場合に使用されます。Pythonの同等物は何ですか?
numpy や pandas などのライブラリは欠損値をどのように処理しますか?
scikit-learn は欠損値をどのように処理しますか?
Python 2.7 と Python 3 では違いますか?
PythonのRのNAに相当するものは何ですか?
具体的には、R には NaN、NA、NULL、Inf、および -Inf があります。NA は通常、欠損データがある場合に使用されます。Pythonの同等物は何ですか?
numpy や pandas などのライブラリは欠損値をどのように処理しますか?
scikit-learn は欠損値をどのように処理しますか?
Python 2.7 と Python 3 では違いますか?
nan
in numpy は多くの関数でうまく処理されます:
>>> import numpy as np
>>> a = [1, np.nan, 2, 3]
>>> np.nanmean(a)
2.0
>>> np.nansum(a)
6.0
>>> np.isnan(a)
array([False, True, False, False], dtype=bool)
これをpandas
見てください。
http://pandas.pydata.org/pandas-docs/dev/missing_data.html
パンダは使用しNaN
ます。isnull()
またはを使用して null 値をテストし、etcnot null()
を使用してデータ フレームから削除できます。オブジェクトdropna()
の同等datetime
物は次のとおりです。NaT