私は現在Hmisc
、以下の例のように、パッケージを使用してデータをきちんとカットしようとしています:
dummy <- data.frame(important_variable=seq(1:1000))
require(Hmisc)
dummy$cuts <- cut2(dummy$important_variable, g = 4)
生成されたカットは、値に関して正しいです。
important_variable cuts
1 1 [ 1, 251)
2 2 [ 1, 251)
3 3 [ 1, 251)
4 4 [ 1, 251)
5 5 [ 1, 251)
6 6 [ 1, 251)
> table(dummy$cuts)
[ 1, 251) [251, 501) [501, 751) [751,1000]
250 250 250 250
ただし、データを少し異なる方法で表示したいと思います。たとえば、代わりに
[ 1, 251 )
[ 251, 501 )
表記の方がいいです
1 - 250
251 - 500
複数の変数に対して多くのことを行っているので、複数の変数に簡単に適用できる再現可能なソリューションに興味があります。
編集
コメントでの議論に続いて、ソリューションは のようなより厄介な変数で動作する必要がありますx2 <- runif(100, 5.0, 7.5)
。