做连续变量的meta分析时,需要在文献中提取两组的均值(mean)、标准差(standard deviation, sd)和样本量(sample size或n)。然而,有的文献并没有明确说明数据是mean±sd还是mean±se,有的文献报道了数据是mean±sd,但又不一定是对的。怎样才能判断呢?很简单,不合理的数据一定有问题。我们用两个例子进行说明。
以下表为例1,平均孕周、胎儿重量是连续变量,以A±B的形式表示,在缺乏备注信息的情况下,我们不知道这是mean±sd,还是mean±se。但是,只要稍微计算一下,就知道这是mean±sd。
我们看两组的平均孕周,都是34.9±1.8周。假设1.8是标准误,按照SD=SE*√n进行换算,SD=1.8*√1393 = 1.8*37.32 =67.18,SD远大于mean,显然不合理。
同理,假设1.8是标准差,对于符合正态分布的数据,落在mean±2sd(34.9±2*1.8),也就是31.3-38.5周的概率是95%。这个与孕周的分组情况基本一致。
结合上面两点,可以推断数据为mean±sd。
同样的,我们再看一下这个表格。文献备注了数据是x±s,也就是mean±sd。可是,我们能相信它吗?显然不能。
以TPTX组术后1年的血钙为例,如果2.30±0.05是mean±sd,也就是标准差为0.05,那么se=0.05/√97 =0.05/9.85=0.0051,标准误这么小,我是持怀疑态度的。
另外,如果0.05是标准差,数据落在mean±2sd(2.30±2*0.05),也就是2.20-2.40 mmol/L的概率是95%。在我看来这个范围也是小了。
当然,其实我更倾向于认为这篇文献的数据是杜撰的,血清iPTH的数据更值得怀疑。还有TPTX+AT组,术后1周、术后3个月的血钙水平,标准差都是0.40,而其他时间点只有0.06或0.04。均值相差不大,甚至近似相等的情况下,标准差相差这么大,很值得怀疑。