風のデータを分析するために、光沢のあるオープンエアを使用してアプリを構築しています。
現在、ユーザーがアップロードする前に、データを「クリーニング」する必要があります。これを自動的に行うことに興味があります。一部のデータは空で、一部は数値ではないため、風配図を作成することはできません。したい:
- 1. 数値以外のデータの割合を見積もる
2. 数値データだけを切り取って残す
ここにデータの例があります:
"NO2.mg" は因数として読み取られ、int ではありません。数値だけで構成されていないため
です。OK
ここに再現可能な例があります。
no2<-factor(c(5,4,"c1",54,"c5",seq(2:50)))
no2
[1] 5 4 c1 54 c5 1 2 3 4 5 6 7 8 9 10 11 12 13 14
[20] 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33
[39] 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49
52 Levels: 1 10 11 12 13 14 15 16 17 18 19 2 20 21 22 ... c5
> as.numeric(no2)
[1] 45 34 51 46 52 1 12 23 34 45 47 48 49 50 2 3 4 5 6
[20] 7 8 9 10 11 13 14 15 16 17 18 19 20 21 22 24 25 26 27
[39] 28 29 30 31 32 33 35 36 37 38 39 40 41 42 43 44