基本的に、データセットの欠落値が継続的に繰り返されているかどうかを確認したいと思います。データセットに数え切れないほど繰り返される欠測値がある場合、連続して繰り返される欠測値セットのそれぞれの長さが証明書番号を超えているかどうかを知りたいです。
例えば:
data =['1', '0', '9', '31', '11', '12', 'nan', '10', '44', '53', '12', '66', '99', '3', '2', '6.75833',....., 'nan', 'nan', 'nan', '3', '7', 'nan', 'nan']
data
上記では、の総数は6'nan'
になり、で計算できますdata.count('nan')
。しかし、私が知りたいのは、欠落している値をどれだけ継続的に繰り返すことができるかということです。このデータの場合、答えは3になります。
サンプルコードを表示していないことをお詫びしますが、私はこの分野の初心者であり、コーディングのアイデアがまったくありませんでした。
任意のアイデア、ヘルプ、またはヒントをいただければ幸いです。