0

G'day All、

私はRで働いています。この本当に基本的な質問について申し訳ありませんが、私は少し立ち往生しています。カウント日とサイト番号を含む存在/不在ポイントカウントデータのデータセットがあります(以下を参照)。最終的に、グリッドセル番号ごとにすべてのカウントを照合し、サイトへの各訪問を新しい訪問として持つdata.frameを作成したいと思います(以下を参照)。これを行う方法がわからないので、もっと簡単なルートを取り、各レコードの訪問数を示す列を作成することを考えました。したがって、この列には、各サイトグループ内の訪問日ごとの各レコードの番号が表示されます(以下を参照)。私もこれを行う方法を理解することはできません!どんな助けでも素晴らしいでしょう、事前にありがとう。

よろしく、アダム

私はこれを持っています:

Site    date
1   12/01/2000
1   24/02/2000
1   13/08/2001
2   14/01/2000
2   21/01/2002
3   1/01/1999
3   21/04/2000

最終的にこれが欲しい:

Site           vist1              v2                 v3
1              12/01/2000         24/02/2000         13/08/2001
2              14/01/2000         21/01/2002         na
3              01/01/1999         21/04/2000         na

しかし、これは良いことです:

Site   date        visit
1      12/01/2000  1
1      24/02/2000  2
1      13/08/2001  3
2      14/01/2000  1
2      21/01/2002  2
3      01/01/1999  1
3      21/04/2000  2
4

3 に答える 3

2

Site基本的に、データを長い形式から広い形式に再形成し、すべてを 1 行で繰り返し観測したいと考えています。ベース R 関数reshape()は、まさにこのタスクのために設計されました。

obsNum唯一の (わずかな) 複雑さは、最初に での最初、2 番目、3 番目などの観測を識別する列 (ここでは と呼びます) を最初に追加する必要があることですSite。を設定することで、 の各値をどの列に入れたいかを知るtimevar = "obsNum"ことができます。reshape()date

df <- read.table(text = "Site date
1 12/01/2000
1 24/02/2000
1 13/08/2001
2 14/01/2000
2 21/01/2002
3 1/01/1999
3 21/04/2000", header=T, stringsAsFactors=FALSE)

df$obsNum <- unlist(sapply(rle(df$Site)$lengths, seq))
reshape(df, idvar="Site", timevar="obsNum", direction="wide")

#   Site     date.1     date.2     date.3
# 1    1 12/01/2000 24/02/2000 13/08/2001
# 4    2 14/01/2000 21/01/2002       <NA>
# 6    3  1/01/1999 21/04/2000       <NA>
于 2012-02-06T00:13:00.457 に答える
0

と を使用した別のソリューションを次に示しddplyますdcast

library(reshape2)
# Convert the date column into actual dates
df$date <- as.Date(df$date, format="%d/%m/%Y")
# Ensure that the data.frame is sorted
df <- df[ order(df$site, df$date), ]

# Number the visits for each site
df$visit <- 1
d <- ddply(df, "Site", transform, visit=cumsum(visit))

# Convert to a wide format
# (Since dcast forgets the Date type, convert it to strings
# before and back to dates after.)
d$date <- as.character(d$date)
d <- dcast(d, Site ~ visit, value.var="date")
d[,-1] <- lapply(d[,-1], as.Date)
d
于 2012-02-06T00:33:48.860 に答える
0

plyrと を使用したソリューションの別の例を次に示しreshape2ます。

require(plyr); require(reshape2); require(lubridate)
df <- ddply(df, .(Site), transform, visit = rank(dmy(date)))
dcast(df, Site ~ visit, value.var = 'date')
于 2012-02-06T02:17:37.463 に答える