0

R を使用して行を列に集約しようとしています。これが私のデータセットのサンプルです。

age sex hash                                emotion     color
22  1   b17f9762462b37e7510f0e6d2534530d    Lonely      #006666
22  1   b17f9762462b37e7510f0e6d2534530d    Energetic   #66CC00
22  1   b17f9762462b37e7510f0e6d2534530d    Calm        #FFFFFF
22  1   b17f9762462b37e7510f0e6d2534530d    Angry       #FF0000
24  1   7bb50ca97a9b517239b39440a966d2f6    Calm        #006666
24  1   7bb50ca97a9b517239b39440a966d2f6    Excited     #0033cc
24  1   7bb50ca97a9b517239b39440a966d2f6    Empty/void  #999999
24  1   7bb50ca97a9b517239b39440a966d2f6    No emotion  #FF6600
26  1   209f1ba8ef86e855deccc0aae120825c    Comfortable #330066
21  1   b9e9309c0b1255a7efb2edf9ba66ae46    Energetic   #330099
21  1   b9e9309c0b1255a7efb2edf9ba66ae46    Happy       #330066
26  1   209f1ba8ef86e855deccc0aae120825c    No emotion  #FFCC00
26  1   209f1ba8ef86e855deccc0aae120825c    Calm        #006666
21  1   61debd3dea6d1aacce5c9fc7daec4fe5    Empty/void  #FFFFFF
21  1   b9e9309c0b1255a7efb2edf9ba66ae46    Calm        #006666
26  1   209f1ba8ef86e855deccc0aae120825c    No emotion  #339900
21  1   61debd3dea6d1aacce5c9fc7daec4fe5    Loved       #FF6600
26  1   209f1ba8ef86e855deccc0aae120825c    No emotion  #66CC00

私がやりたいのは、これを取得することです:

age sex hash            #000000 #FF0000 ... #FFFFFF
22  1   8798tkojstwz9ei sad     happy   ... loved
...

1 つの応答はハッシュによって定義され、関連するデータは年齢と性別です。

複数の列ではなく、各応答を1つにしたい。各色には独自の列と、その列の値として関連付けられた感情が必要です。

データセット全体には、13 色、20 以上の感情、1000 以上の応答があります。データセットはサンプルとまったく同じように見え、mySQL データベースに保存されます。

reshape を試してみましたが、カテゴリ データでうまく機能しないか、適切な関数を使用していませんでした。何か案は?必要に応じて、mySQL の準備を含めることができます。Javaはここでは非常に遅く、12k以上の行があるため、Rはこれに適しているように聞こえます。

ありがとうございました。

4

2 に答える 2

2

使用してreshape2

dcast(dat,...~color,value.var='emotion')
  age sex                             hash #0033cc #006666     #330066   #330099   #339900   #66CC00 #999999 #FF0000   #FF6600
1  21   1 61debd3dea6d1aacce5c9fc7daec4fe5    <NA>    <NA>        <NA>      <NA>      <NA>      <NA>    <NA>    <NA>     Loved
2  21   1 b9e9309c0b1255a7efb2edf9ba66ae46    <NA>    Calm       Happy Energetic      <NA>      <NA>    <NA>    <NA>      <NA>
3  22   1 b17f9762462b37e7510f0e6d2534530d    <NA>  Lonely        <NA>      <NA>      <NA> Energetic    <NA>   Angry      <NA>
4  24   1 7bb50ca97a9b517239b39440a966d2f6 Excited    Calm        <NA>      <NA>      <NA>      <NA>   Empty    <NA> Noemotion
5  26   1 209f1ba8ef86e855deccc0aae120825c    <NA>    Calm Comfortable      <NA> Noemotion Noemotion    <NA>    <NA>      <NA>
    #FFCC00 #FFFFFF
1      <NA>   Empty
2      <NA>    <NA>
3      <NA>    Calm
4      <NA>    <NA>
5 Noemotion    <NA>
于 2013-01-13T18:20:05.677 に答える
1

あなたの目的を正しく理解していれば、reshape()まさにあなたが探している機能です。データセットが と呼ばれていると仮定してmydf、これを試してください:

reshape(mydf, direction = "wide", 
        idvar = c("hash", "age", "sex"), 
        timevar = "color")
#    age sex                             hash emotion.#006666 emotion.#66CC00
# 1   22   1 b17f9762462b37e7510f0e6d2534530d          Lonely       Energetic
# 5   24   1 7bb50ca97a9b517239b39440a966d2f6            Calm            <NA>
# 9   26   1 209f1ba8ef86e855deccc0aae120825c            Calm      No emotion
# 10  21   1 b9e9309c0b1255a7efb2edf9ba66ae46            Calm            <NA>
# 14  21   1 61debd3dea6d1aacce5c9fc7daec4fe5            <NA>            <NA>
# emotion.#FFFFFF emotion.#FF0000 emotion.#0033cc emotion.#999999 emotion.#FF6600
# 1             Calm           Angry            <NA>            <NA>            <NA>
# 5             <NA>            <NA>         Excited      Empty/void      No emotion
# 9             <NA>            <NA>            <NA>            <NA>            <NA>
# 10            <NA>            <NA>            <NA>            <NA>            <NA>
# 14      Empty/void            <NA>            <NA>            <NA>           Loved
# emotion.#330066 emotion.#330099 emotion.#FFCC00 emotion.#339900
# 1             <NA>            <NA>            <NA>            <NA>
# 5             <NA>            <NA>            <NA>            <NA>
# 9      Comfortable            <NA>      No emotion      No emotion
# 10           Happy       Energetic            <NA>            <NA>
# 14            <NA>            <NA>            <NA>            <NA>

必要に応じて、後で列の名前を変更できます。

于 2013-01-13T18:18:20.053 に答える