レプリケーションのために、各データ フレームのメタ データを含むコードブックを保持するのが好きです。データ コードブックは次のとおりです。
データベースに含まれる変数の明確かつ包括的な説明を提供する、書面またはコンピューター化されたリスト。 Marczyk ら( 2010 )
変数の次の属性を文書化するのが好きです。
- 名前
- 説明 (ラベル、フォーマット、スケールなど)
- ソース (例: 世界銀行)
- ソース メディア (URL とアクセス日、CD と ISBN など)
- ディスク上のソース データのファイル名 (コードブックをマージするときに役立ちます)
- ノート
たとえば、これは、データ フレームmydata1の変数を 8 つの変数で文書化するために実装しているものです。
code.book.mydata1 <- data.frame(variable.name=c(names(mydata1)),
label=c("Label 1",
"State name",
"Personal identifier",
"Income per capita, thousand of US$, constant year 2000 prices",
"Unique id",
"Calendar year",
"blah",
"bah"),
source=rep("unknown",length(mydata1)),
source_media=rep("unknown",length(mydata1)),
filename = rep("unknown",length(mydata1)),
notes = rep("unknown",length(mydata1))
)
読み取ったデータセットごとに異なるコードブックを作成します。データ フレームをマージするとき、関連するコードブックの関連する側面もマージして、最終的なデータベースを文書化します。これを行うには、基本的に上記のコードをコピーして貼り付け、引数を変更します。