R语言使用WinBUGS软件建立了学术能力测试(SAT)的分层模型

R2winbugs包提供了从R调用WinBUGS的方便功能。它以WinBUGS可读格式自动写入数据和脚本以进行批处理(自版本1.4起)。WinBUGS过程完成后,结果数据可以通过包本身(提供推理和收敛诊断的紧凑图形摘要)读入R,或者可以使用coda包的功能进一步分析输出。 

Winbugs Software is available fromhttp://www.mrc-bsu.cam.ac.uk/bugs/ 免费的。  

 

 

例子

 

学校数据

学术能力测验(SAT)衡量高中生的能力,以帮助大学做出入学决定。 我们的数据来自1970年代后期进行的一项实验,来自八所高中的SAT-V(学业能力测试语言)。SAT-V是由教育测试服务局管理的标准多项选择测试。该服务对所选学校中每所学校的教练计划的效果很感兴趣。

 

实现

R2WinBUGS软件包的实现非常简单。\ main“函数bugs() 旨在由用户调用。原则上,它是对 其中逐步调用的其他几个函数的包装,如下:
1. bugs.data.inits()写入数据文件’ data.txt”和“ inits1.txt”,“ inits2.txt” …进入 工作目录。 
2. bugs.script()写入WinBUGS用于批处理的文件“ script.txt”。
3. bugs.run()更新WinBUGS注册表中自适应阶段的长度 ,调用WinBUGS,并使用 ‘script.txt’ 以批处理模式运行它。
R2WinBUGS软件包的实现非常简单。\ main“函数bugs()
 原则上,它是对 其中逐步调用的其他几个函数的包装,如下:
1. bugs.data.inits()写入数据文件’ data.txt”和“ inits1.txt”,“ inits2.txt” …进入 工作目录,这些文件将由WinBUGS在批处理过程中使用。 

2 . bugs.script()写入文件“ script”。 txt”,由WinBUGS用于批处理 。

3. bugs.run()更新WinBUGS注册表中自适应阶段的长度(使用bugs.update.settings()函数),调用WinBUGS并批量运行“script.txt”。
4. bugs.sims()如果参数codaPkg已设置为false(默认值)才调用。
否则,bugs()返回存储数据的文件名。例如,这些可以通过打包的coda 导入,该软件包提供了收敛诊断,蒙特卡洛估计的计算,迹线图等功能。
bugs.sims()函数将WinBUGS中的模拟读取到R中(不一定 由bugs()本身调用),将其格式化,监视收敛,执行收敛检查并
计算中位数和分位数。它还为bugs()本身准备输出。
这些功能不旨在由用户直接调用。 如果合适,参数将从bugs()传递给其他函数。一个简短的bugs()帮助文件,其中列出了 
软件包R2WinBUGS 之后,请在R中进行调试 
 

例子 

我们将 R2WinBUGS提供的功能应用于示例数据并分析输出。


学校数据

示例数据 :
 

> schools

为了对这些数据进行建模,我们使用了Gelman等人提出的分层模型。 我们假设每所学校的观测估计值具有正态分布,且均值theta 和反方差tau.y。逆方差为1 =σ.y2,其先验分布在(0,1000)上是均匀的。对于均值theta,我们采用另一个正态分布 平均mu.theta和反方差tau.theta。有关其先前的分布,请参见以下
WinBUGS代码:

  1. model {

  2. for (j in 1:J)

  3. {

  4. y[j] ~ dnorm (theta[j], tau.y[j])

  5. theta[j] ~ dnorm (mu.theta, tau.theta)

  6. tau.y[j] <- pow(sigma.y[j], -2)

  7. }

  8. mu.theta ~ dnorm (0.0, 1.0E-6)

  9. tau.theta <- pow(sigma.theta, -2)

  10. sigma.theta ~ dunif (0, 1000)

  11. }

此模型必须存储在单独的文件中,例如’schools.bug’2,在适当的目录中,例如c:/ schools /。在R中,用户必须准备bugs()函数所需的数据输入。这可以是包含每个数据向量名称的列表,例如

> J <- nrow(schools)

 使用这些数据和模型文件,我们可以运行MCMC模拟以获取theta, mu.theta和sigma.theta的估计值。在运行之前,用户必须确定要运行多少个链 (n.chain = 3)和迭代次数(n.iter = 1000)。另外,用户必须指定链的初始值,例如通过编写函数。

  1. > inits <- function(){

  2. + list(theta = rnorm(J, 0, 100), mu.theta = rnorm(1, 0, 100),

  3. + sigma.theta = runif(1, 0, 100))

  4. + }

可以开始MCMC模拟,R中的参数bugs.directory必须指向WinBUGS的安装目录。可以通过print(schools.sim)方便地打印school.sim对象中的结果。 泛型函数print()调用由R2WinBUGS提供的类错误对象的print方法。
对于此示例,将获得类似的结果

  1. Inference for Bugs model at "c:/schools/schools.bug"

  2. 3 chains, each with 1000 iterations (first 500 discarded)

  3. n.sims = 1500 iterations saved

  4. mean sd 2.5% 25% 50% 75% 97.5% Rhat n.eff

  5. theta[1] 11.1 9.1 -3.0 5.0 10.0 16.0 31.8 1.1 39

  6. theta[2] 7.6 6.6 -4.7 3.3 7.8 11.6 21.1 1.1 42

  7. theta[3] 5.7 8.4 -12.5 0.6 6.1 10.8 21.8 1.0 150

  8. theta[4] 7.1 7.0 -6.6 2.7 7.2 11.5 21.0 1.1 42

  9. theta[5] 5.1 6.8 -9.5 0.7 5.2 9.7 18.1 1.0 83

  10. theta[6] 5.7 7.3 -9.7 1.0 6.2 10.2 20.0 1.0 56

  11. theta[7] 10.4 7.3 -2.1 5.3 9.8 15.3 25.5 1.1 27

  12. theta[8] 8.3 8.4 -6.6 2.8 8.1 12.7 26.2 1.0 64

  13. mu.theta 7.6 5.9 -3.0 3.7 8.0 11.0 19.5 1.1 35

  14. sigma.theta 6.7 5.6 0.3 2.8 5.1 9.2 21.2 1.1 46

  15. deviance 60.8 2.5 57.0 59.1 60.2 62.1 66.6 1.0 170

  16. pD = 3 and DIC = 63.8 (using the rule, pD = var(deviance)/2)

  17. For each parameter, n.eff is a crude measure of effective sample size,

  18. and Rhat is the potential scale reduction factor (at convergence, Rhat=1).

  19. DIC is an estimate of expected predictive error (lower deviance is better).

此外,用户可以通过键入plot(schools.sim)生成结果图。 结果图如图4所示。在该图中,左列显示了以下内容的快速摘要:
推论和收敛(所有参数的Rb都接近1.0,表明三个链的良好混合,因此近似收敛);右列显示每组参数的推论。从右栏中可以看到,R2WinBUGS使用 WinBUGS中的参数名称将输出构造为标量,向量和参数数组。

资源下载: