r - 2 つのベクトルから帯状疱疹を作成する

Question

2 つの列に従ってデータフレームの値を分類したいと思います。たとえば、次のデータフレームがあるとします。

my.df <- data.frame(a=c(1:20), b=c(61:80))

そして今、2D 散布図を 4 つの等しい部分に分割し、4 つの部分のそれぞれの 4 分の 1 で構成される中央に長方形を重ねることで、8 つの領域に細分したいと考えています。これまでのところ、私は次の退屈な方法を使用してきました。

ar <- range(my.df$a)
br <- range(my.df$b)

aint <- seq(ar[1], ar[2], by=(ar[2]-ar[1])/4)
bint <- seq(br[1], br[2], by=(br[2]-br[1])/4)

my.df$z <- NA
my.df[which(my.df$a < aint[3] & my.df$b < bint[3]),"z"] <- 1
my.df[which(my.df$a < aint[3] & my.df$b >= bint[3]),"z"] <- 2
...
my.df[which(my.df$z == 1 & my.df$a >= aint[2] & my.df$b >= bint[2]),"z"] <- 5
...

よりきちんとした、より一般的な方法、つまり一般的な関数を書く方法があるに違いないと確信していますが、自分で書くのに苦労しています。

また、この後、列のクラスzが自動的にに設定されていることに驚きましたshingle。どうして？これがであることをどのようにR「知る」のshingleですか?

score 1 · Accepted Answer

最初に 16 のグループに分割し (x と y を個別に 4 つのグループに)、それらを組み合わせてより少ないグループに戻すことでアプローチします。

my.df$a.q <- cut(my.df$a, breaks=4, labels=1:4)
my.df$b.q <- cut(my.df$b, breaks=4, labels=1:4)
my.df$a.b.q <- paste(my.df$a.q, my.df$b.q, sep=".")
my.df$z <- c("1.1"=1, "1.2"=1, "1.3"=2, "1.4"=2, 
             "2.1"=1, "2.2"=3, "2.3"=4, "2.4"=2,
             "3.1"=5, "3.2"=6, "3.3"=7, "3.4"=8,
             "4.1"=5, "4.2"=5, "4.3"=8, "4.4"=8)[my.df$a.b.q]

これは理にかなっている

plot(my.df$a, my.df$b, col=my.df$z)

より多くのカバレッジを持ついくつかのデータを使用:

set.seed(1234)
my.df <- data.frame(a=runif(1000, 1, 20), b=runif(1000, 61, 80))

ここに画像の説明を入力

r - 2 つのベクトルから帯状疱疹を作成する

1 に答える 1

Related

Reference