连续型变量meta分析，提取数据时如何判断文献报道的是标准差还是标准误

做连续变量的meta分析时，需要在文献中提取两组的均值（mean）、标准差（standard deviation, sd）和样本量（sample size或n）。然而，有的文献并没有明确说明数据是mean±sd还是mean±se，有的文献报道了数据是mean±sd，但又不一定是对的。怎样才能判断呢？很简单，不合理的数据一定有问题。我们用两个例子进行说明。

以下表为例1，平均孕周、胎儿重量是连续变量，以A±B的形式表示，在缺乏备注信息的情况下，我们不知道这是mean±sd，还是mean±se。但是，只要稍微计算一下，就知道这是mean±sd。

我们看两组的平均孕周，都是34.9±1.8周。假设1.8是标准误，按照SD=SE*√n进行换算，SD=1.8*√1393 = 1.8*37.32 =67.18，SD远大于mean，显然不合理。

同理，假设1.8是标准差，对于符合正态分布的数据，落在mean±2sd（34.9±2*1.8），也就是31.3-38.5周的概率是95%。这个与孕周的分组情况基本一致。

结合上面两点，可以推断数据为mean±sd。

同样的，我们再看一下这个表格。文献备注了数据是x±s，也就是mean±sd。可是，我们能相信它吗？显然不能。

以TPTX组术后1年的血钙为例，如果2.30±0.05是mean±sd，也就是标准差为0.05，那么se=0.05/√97 =0.05/9.85=0.0051，标准误这么小，我是持怀疑态度的。

另外，如果0.05是标准差，数据落在mean±2sd（2.30±2*0.05），也就是2.20-2.40 mmol/L的概率是95%。在我看来这个范围也是小了。

当然，其实我更倾向于认为这篇文献的数据是杜撰的，血清iPTH的数据更值得怀疑。还有TPTX+AT组，术后1周、术后3个月的血钙水平，标准差都是0.40，而其他时间点只有0.06或0.04。均值相差不大，甚至近似相等的情况下，标准差相差这么大，很值得怀疑。

资源下载：

下载地址： http://yemao.in/life?utm_source=sishubiji&utm_term=连续型变量meta分析，提取数据时如何判断文献报道的是标准差还是标准误