Rを使用しています
set.seed(1)
Data <- data.frame(id = seq(1, 10),
Diag1 = sample(c("A123", "B123", "C123"), 10, replace = TRUE),
Diag2 = sample(c("D123", "E123", "F123"), 10, replace = TRUE),
Diag3 = sample(c("G123", "H123", "I123"), 10, replace = TRUE),
Diag4 = sample(c("A123", "B123", "C123"), 10, replace = TRUE),
Diag5 = sample(c("J123", "K123", "L123"), 10, replace = TRUE),
Diag6 = sample(c("M123", "N123", "O123"), 10, replace = TRUE),
Diag7 = sample(c("P123", "Q123", "R123"), 10, replace = TRUE))
Data
このようなデータフレームがあります。実際には、34 の変数と 1.5 Mio の観測値があります。これは、患者データを含むデータ フレームです。(ID & 診断 (ICD10) A123 と B123 は特定の診断を表します。これらの診断を持つすべての患者を抽出したいと考えています。実際、数百の異なる ICD10 診断から 6 つの診断を探しています。探している診断はすべて、いずれの列にも表示されますが、それらは相互に排他的です. 最終的に、1.5 Mio ではなく約 4000 観測のデータ フレームが得られます.
私の目標は、A123 または B123 を含む行を保持するデータ フレームを取得することです。A123 と B123 を同じ列にすることはできません。ただし、すべての列に表示できます。
これを行うと、1つの変数に対してそれを行うことができます:
DataA123 <- Data[Data$Diag1 == "A123", ]
しかし、すべての変数と、A123 と B123 (実際にはこのような 6 つの要因があります) について一緒に実行したいと考えています。
これは可能ですか?