私は最近、doForms (ODK の派生物) を使用して一連の調査データを収集し始めました。データを RI にロードすると、データを完全に再形成する必要があることに気付きました。私の調査では、すべて構造化された観察である9つの質問のループがあるため、列名は連続しています。
例の場合。
colnames(MasterDataframe)
[1] "Date_Created" "WaterType" "Unique_barcode" "VolumeStart.1."
[5] "StartTime.1." "StopTime.1." "VolumeEnd.1." "UserType.1."
[9] "NYoungChildren.1." "NChildren.1." "NAdults.1." "EventType.1."
[13] "VolumeStart.2." "StartTime.2." "StopTime.2." "VolumeEnd.2."
[17] "UserType.2." "NYoungChildren.2." "NChildren.2." "NAdults.2."
[21] "EventType.2." "VolumeStart.3." "StartTime.3." "StopTime.3."
[25] "VolumeEnd.3." "UserType.3." "NYoungChildren.3." "NChildren.3."
[29] "NAdults.3."
これはかなりの時間続きます。しかし、ここでパターンを見ることができます。
ループデータを抽出し、最初に元のデータフレームの1行の独自のdata.frameに入れる方法を理解しようとしています。たとえば、ループに 9 つの質問があり、20 個のループ (MasterDataFrame に 180 個の列ヘッダー) があるとします。これを 9 個の変数と 20 個の観測値を持つデータ フレームに圧縮する必要があります。
ここでの注意点は、masterdataframe のどの行にも可変量のループが含まれていることです。
この問題にアプローチする方法がわかりません。正しい方向への一歩は役に立ちます。
Google ドキュメントを介してこのデータフレームにロードするため、自分で見ることができます。
require(RCurl)
myCsv <- getURL('https://docs.google.com/spreadsheet/pub?key=0AhVuJMYFyexYdEpKWkFMby1QMXJhOVVXVXVtekFlbkE&single=true&gid=1&output=csv', cainfo='cacert.pem')
MasterDataFrame<- (read.csv(textConnection(myCsv),stringsAsFactors = FALSE))
編集:これにより、「作品を表示する」ことができないため、否定的なレビューが発生する可能性があると考えましたが、どのような方向性も非常に高く評価されています。尋ねる正しい質問が何であるかわからず、「ループされた」列データの概念について何かを見つけることができませんでした。