1

私は最近、doForms (ODK の派生物) を使用して一連の調査データを収集し始めました。データを RI にロードすると、データを完全に再形成する必要があることに気付きました。私の調査では、すべて構造化された観察である9つの質問のループがあるため、列名は連続しています。

例の場合。

  colnames(MasterDataframe)
  [1] "Date_Created"        "WaterType"           "Unique_barcode"      "VolumeStart.1."     
  [5] "StartTime.1."        "StopTime.1."         "VolumeEnd.1."        "UserType.1."        
  [9] "NYoungChildren.1."   "NChildren.1."        "NAdults.1."          "EventType.1."       
 [13] "VolumeStart.2."      "StartTime.2."        "StopTime.2."         "VolumeEnd.2."       
 [17] "UserType.2."         "NYoungChildren.2."   "NChildren.2."        "NAdults.2."         
 [21] "EventType.2."        "VolumeStart.3."      "StartTime.3."        "StopTime.3."        
 [25] "VolumeEnd.3."        "UserType.3."         "NYoungChildren.3."   "NChildren.3."       
 [29] "NAdults.3." 

これはかなりの時間続きます。しかし、ここでパターンを見ることができます。

ループデータを抽出し、最初に元のデータフレームの1行の独自のdata.frameに入れる方法を理解しようとしています。たとえば、ループに 9 つの質問があり、20 個のループ (MasterDataFrame に 180 個の列ヘッダー) があるとします。これを 9 個の変数と 20 個の観測値を持つデータ フレームに圧縮する必要があります。

ここでの注意点は、masterdataframe のどの行にも可変量のループが含まれていることです。

この問題にアプローチする方法がわかりません。正しい方向への一歩は役に立ちます。

Google ドキュメントを介してこのデータフレームにロードするため、自分で見ることができます。

    require(RCurl)        
    myCsv <- getURL('https://docs.google.com/spreadsheet/pub?key=0AhVuJMYFyexYdEpKWkFMby1QMXJhOVVXVXVtekFlbkE&single=true&gid=1&output=csv', cainfo='cacert.pem')
  MasterDataFrame<- (read.csv(textConnection(myCsv),stringsAsFactors = FALSE))

編集:これにより、「作品を表示する」ことができないため、否定的なレビューが発生する可能性があると考えましたが、どのような方向性も非常に高く評価されています。尋ねる正しい質問が何であるかわからず、「ループされた」列データの概念について何かを見つけることができませんでした。

4

2 に答える 2