15年間、5413社からなるデータストリームからロンドン証券取引所の株価データをダウンロードしてきました。Datastream からデータをダウンロードすると、データが利用できない会社は、列ラベルの会社名が #ERROR に置き換えられます。
Date A B #ERROR #ERROR E F
31-12-1999 1 2 3 4
3-1-2000
したがって、Rにインポートすると、
Date A B X. ERROR X.ERROR.1 E F
1999-12-31 1 2 3 4
2000-1-3 NA NA NA NA
ご覧のとおり、R はそれを X.ERROR および X.ERROR.1 に変更し、行はブランクであり、NA が割り当てられていません。私のデータセットは巨大で、適用するのは非常に面倒Price$X.ERROR <- NULL
です。さらに、私はそれが非効率的であることを発見しました。では、データセットでこれらすべての X:ERROR を見つけて、これらの列を削除するにはどうすればよいでしょうか。