0

質問からのビッグデータセットがあります。SPSSからRに(SPSSのStata-Outputを使用して)インポートすると、各質問に対する答えが要因として得られました。

質問には1から10までの回答があります。ただし、欠落している値がたくさんあります。Rはそれらも認識します。

ただし、ここでいくつかの計算を行いたいと思います。たとえば、回答の平均を計算したいのです(あまり良い統計ではありませんが、気にしないでください)。

したがって、係数を数値に再コード化する必要があります。私はこれをで行いましas.numeric()た。

ただし、現在、11から14としてエンコードされた欠落値があります。もちろん、このような平均を計算することはできません。

因子を数値として再コード化し、Rに10より大きい値をNAに設定するように指示する適切な方法は何でしょうか?

例:あなたは魚が好きですか?

    not at all                   very much | don't know  no answer  don't tell
R:  1   2   3   4   5   6   7   8   9   10 |     11          12         13
4

2 に答える 2

4

データフレームを呼び出しましょうdata(最初にコピーを取りたい場合があります)。以下は、すべての列の10より大きいすべての値を次のように設定しますNA

data[data>10]<-NA

上記は、あなたがすでに適用していることを前提としていますas.numeric

于 2011-02-23T17:44:01.977 に答える
3

不足している値が本当に必要ない場合は、次のようにします。

a[a>10] <- NA

次に、次を使用できます。

mean(a, na.rm=TRUE)

または、これらの欠落している値を回避する場合は、次を使用できます。

mean(a[a<=10])
于 2011-02-23T17:44:27.887 に答える