ここにある A/B テスト データセットのベイズ係数を計算しようとしています。ただし、ベータ係数がゼロに評価されるため、最終的に NaN になります。尤度の計算では、二項分布に従うと仮定しています。したがって、私は次の式に従っています。
可能性 = choose(n,k) * Beta(k+1,n-k+1)
コードは以下にあります
data <- read.csv(file="ab_data.csv", header=TRUE, sep=",")
control <- data[which(data$group == "control"),]
treatment <- data[which(data$group == "treatment"),]
#compute bayes factor
n1 = nrow(control)
r1 = sum(control$converted)
n2 = nrow(treatment)
r2 = sum(treatment$converted)
likelihood_control <- choose(n1,r1) * beta(r1+1, n1-r1+1)
likelihood_treatment <- choose(n2,r2) * beta(r2+1, n2-r2+1)
bayes_factor <- likelihood_control/ likelihood_treatment
beta(r1+1, n1+r1+1)
beta(r2+1, n2-r2+1)
bayes_factor