3

何十万もの値を含むファイルが渡されましたが、.CSV ファイルの形式に一貫性がありません。構造は次のようになります。

A,B,C,D
E,F
,H,I,J,K,L,M,N,O
P,Q,R,S

等々。

私がする必要があるのは、a) 一意の値をリストし、b) 同じ値のインスタンスをカウントすることだけです。R、Excel、または推奨されるその他のツールでこれを実行してください。

通常、Google ドキュメントの =UNIQUE 関数や =COUNT 関数などを使用しますが、スプレッドシートが大きすぎて読み込めません。奇妙なことに、まったく同等のものを Excel で見つけたこともありません。

どんな助けでも感謝します。

4

3 に答える 3

0

データをRにインポートする方法を知っていると思いますか? read.csv のようなものが動作するはずです... 適用タイプの関数に入ることなく、単純なループを実行して一意の値 (文字など) の数を検索できます。

set.seed(1)

OBJ <- LETTERS[round(runif(1000, min=1, max=26))]
VALS <- unique(OBJ)
VALS
COUNTS <- rep(0*length(VALS))
for(i in seq(VALS)){
    COUNTS[i] <- length(which(OBJ==VALS[i]))
}

data.frame(VALS, COUNTS)
于 2012-05-16T14:22:41.370 に答える