0

私は統計、R、およびプログラミング全般に不慣れで、深いところに投げ込まれる前に短いコースしか受けていません。しかし、私は自分で物事を解決したいと思っています。

私の最初の仕事は、与えられたデータの異常をチェックすることです。Date列、PersonIDおよびを含むスプレッドシートが与えられましたPlaceID。の各因子をPersonIDに対してプロットするDateと、直線は異常がないことを示しPersonID、一度に 1 か所にしか存在できないと仮定しました。PersonIDただし、 1 つに同じものが 2 つあるDate場合、プロットでこれを表示する方法がないことが懸念されます。

私は簡単なコードを使用しました:

require(ggplot2)
qplot(Date,PersonID)

私の問題は、Dateこの問題をどのように考慮に入れるかわからないことです。基本的に、同じPersonIDに複数の が表示されないことを確認しようとしていますが、2 日間試してみたところ、これら 3 つの変数すべてを同じプロットに配置する方法がわかりません。PlaceIDDate

誰かにコードを書いてもらうように頼んでいるわけではありません。私が正しい考えを持っているかどうかを知りたいだけです。もしそうなら、Rにこれをプロットするように頼むことについてどのように考えるべきですか. 誰でも私を助けることができますか?この質問がかなり長くなってしまった場合、または間違った場所に投稿された場​​合はお詫び申し上げます。

4

1 に答える 1

1

これがデータセットで発生するかどうかだけ知りたい場合は、 を試してくださいduplicated()。たとえば、データフレームが次のように呼ばれるとしますdf

sum(duplicated(df[,c("Date","PersonID")]))

Date列とデータフレームに基づいて重複数を返しますPersonID。ゼロより大きい場合は、データに重複があります。

于 2013-01-11T15:29:34.060 に答える