2

これが私の問題です:

数値が含まれるヒストグラム ビンのインデックスを見つけるにはどうすればよいですか?

Matlab では、ソリューションは簡単です。HISTC は次のことを行います。

[counts,bin] = histc(data,edges)

「ビン」は私が探しているものです。

しかし、私はRで作業しており、Rのhist機能は機能を提案していません。min数行のコード (および などを使用) で管理できると思いますが<、多くの数に対してそれを行う必要があるため、よりエレガントなソリューションを見つけたいと考えています。

私はRの経験があまりないので、別の方法で問題を解決するトリッキーな解決策が存在することを願っています.

4

2 に答える 2

8

ビン間のhistブレークポイントがまだない場合、関数はビン間のブレークポイントを返します。次に、関数を使用して、findInterval各ポイントがどの間隔/ビンに該当するかを見つけることができます。

> tmp <- hist(iris$Petal.Width)
> findInterval(iris$Petal.Width, tmp$breaks)
  [1]  2  2  2  2  2  3  2  2  2  1  2  2  1  1  2  3  3  2  2  2  2  3  2  3  2
 [26]  2  3  2  2  2  2  3  1  2  2  2  2  1  2  2  2  2  2  4  3  2  2  2  2  2
 [51]  7  8  8  7  8  7  9  6  7  7  6  8  6  7  7  7  8  6  8  6 10  7  8  7  7
 [76]  7  7  9  8  6  6  6  7  9  8  9  8  7  7  7  7  7  7  6  7  7  7  7  6  7
[101] 13 10 11 10 12 11  9 10 10 13 11 10 11 11 13 12 10 12 12  8 12 11 11 10 11
[126] 10 10 10 11  9 10 11 12  8  7 12 13 10 10 11 13 12 10 12 13 12 10 11 12 10
> tmp2 <- .Last.value
> cbind( value=iris$Petal.Width, lower=tmp$breaks[tmp2], upper=tmp$breaks[tmp2+1])
       value lower upper
  [1,]   0.2   0.2   0.4
  [2,]   0.2   0.2   0.4
  [3,]   0.2   0.2   0.4
  [4,]   0.2   0.2   0.4
  [5,]   0.2   0.2   0.4
  [6,]   0.4   0.4   0.6
  [7,]   0.3   0.2   0.4
  [8,]   0.2   0.2   0.4
  [9,]   0.2   0.2   0.4
 [10,]   0.1   0.0   0.2
于 2012-01-13T16:40:44.520 に答える
0

histcコードの移植を容易にするために(再) 実装する R パッケージがいくつかあります。例えば、

于 2012-12-05T13:25:22.900 に答える