文献学习-短端粒与癌症死亡率和全因死亡率的关联

摘要

背景:

外周血白细胞端粒短与老年及年龄相关性疾病有关。我们测试了短端粒与增加癌症死亡率和全因死亡率相关的假设。

方法:

个体(n = 64637)从1991年开始从两个丹麦前瞻性队列研究中招募: 哥本哈根城市心脏研究和哥本哈根一般人口研究。他们的端粒长度均以即时聚合酶链式反应测量,基因型 rs1317082(TERC)、 rs7726159(TERT)及 rs2487999(OBFC1)则测定。计算了这三个基因型的端粒缩短等位基因的总和。我们使用等位基因和作为工具进行 Cox 回归分析和工具变量分析。所有的统计学检验都是双侧的。

结果:

在随访期间死亡的7607人中(0-22年,中位数 = 7年) ,2420人患有癌症,2633人死于心血管疾病。

端粒长度十分位数的减少与全因死亡率的增加有关(P 趋势 = 2 * 10-15)。多变量调整后的全因死亡风险比为1.40(95% 的置信区间[ CI ] = 1.25至1.57)。癌症死亡率和心血管死亡率的结果相似。

对于等位基因总和,每个等位基因的端粒长度减少了69个碱基对(95% CI = 61至76) ,癌症死亡率的每个等位基因风险比为0.95(95% CI = 0.91至0.99)。等位基因总和与心血管疾病、其他疾病或全因死亡率无关。

结论:

在关联分析中,外周血白细胞端粒短与高死亡率相关。相比之下,基因决定的短端粒与低癌症死亡率有关,但与全因死亡率无关。

引言

端粒由位于染色体末端的 TTAGGG 核苷酸的蛋白质和串联重复序列组成。在正常有丝分裂的 DNA 复制过程中,端粒 DNA 由于末端复制问题而缩短(1)。当端粒达到极短的长度时,细胞就会衰老,无法进一步分裂。这个过程限制了不受控制的细胞分裂,因此,被认为可以预防癌症(2)。

端粒短与年龄大、男性和不良的生活方式因素如吸烟和肥胖有关(3)。白细胞端粒长度已被研究作为年龄相关疾病如心血管疾病(4,5) ,慢性阻塞性肺病(6-8)和糖尿病(9,10)的潜在生物标志物。它也是一些(4,11,12)但不是所有研究(13)中全因死亡率的标志。

端粒酶在一些癌细胞中被激活,使得它们能够维持有助于癌细胞永生化的端粒长度(2,14)。然而,关于短端粒长度和癌症风险以及癌症诊断后死亡率增加的潜在相关性,存在相互矛盾的证据。一些研究发现端粒短与癌症风险增加有关(15,16) ,而另一些则没有发现(17)。同样,一些发现短端粒患者在癌症诊断后存活率降低(17-20) ,而另一些则没有(21)。

端粒长度和死亡率之间关系的观察性分析被端粒长度和死亡率与年龄,性别,不良生活方式和社会经济特征的强相关性所混淆(3,4)。然而,最近的研究已经确定了与端粒长度相关的基因中的单核苷酸多态性(SNP)(22-25)。这使得对端粒长度与死亡率之间的关系进行遗传分析成为可能。

在一项对64637名个体的研究中,我们测试了这样一个假设,即在外周血白细胞中测量到的短端粒与观察到的癌症死亡率和全因死亡率以及遗传学上的增加有关。

方法

研究设计

我们研究了哥本哈根一般人口研究的56216名参与者,他们在2003年至2009年期间入选,哥本哈根城市心脏研究的8421名参与者在1991年至1994年期间入选。在这些丹麦普通人口研究(4,6)中,哥本哈根居民被邀请完成一份问卷并接受体格检查。抽取血样进行生化测定和 DNA 分离。这两项研究之间没有个体重叠。只有具有可用端粒长度测量和所研究的 SNP 确定的基因型的白色丹麦个体被包括在内(补充图1,可在线获得)。所有参与者都给出了书面知情同意书,丹麦伦理委员会批准了这些研究(H-KF01-144/01和 KF100.2039/91)。

端粒长度测量

使用 Qiagen 血液试剂盒(26)测量从外周血白细胞分离的 DNA 中的端粒长度。我们使用了一种改良的单色多重即时聚合酶链式反应(PCR)方法,这是唯一可用于大规模测量的方法。我们使用白蛋白的参考单拷贝基因来调整样品中不同数量的 DNA。参与者的 DNA 一式四份进行分析。通过在 K562细胞系 DNA 上测量,校准后得出绝对端粒长度,其端粒长度设定为5290个碱基对,由SB法(27)确定,并包括在每个平板中。有关完整的描述,请参阅补充方法(可在线获得)。

基因分型

对研究人群进行 rs1317082、 rs7726159和 rs2487999的基因分型。在一项包括哥本哈根城市心脏研究样本的研究中,我们选择了这三个 SNP,因为它们是与端粒长度相关的 SNP 的效应大小最大的三个最显着的命中(24)。这些 SNP 位于与端粒生物学相关的基因中: rs1317082位于 TERC 基因附近的3q26.2处,rs7726159位于 TERT 基因中的5p15.3处,rs2487999位于 OBFC1基因中的10q24.3处。TERT 和 TERC 编码端粒酶反转录酶和端粒酶 RNA 模板,这是端粒伸长所必需的。OBFC1编码部分调节端粒酶活性的 CST 复合体(29)。我们使用 Taqman 方法(Applied Biosystems,Life Technologies,卡尔斯巴德)对来自哥本哈根一般人口研究的个体进行基因分型。要获得完整的描述,包括关于引物和探针的详细信息,请参阅补充方法和补充表1(可在线获得)。来自哥本哈根市心脏研究的个体的基因分型是使用 Illumina 定制的基因分型芯片(30)(Illumina)进行的。所有基因型均处于 Hardy-Weinberg 平衡状态(chi2检验: rs1317082的 P = .98,rs7726159的 P = .90,rs2487999的 P = .58)。

等位基因和被定义为三种基因型端粒长度缩短等位基因的总和,因此理论上范围从0(3×0)到6(3×2)。我们将具有0和1个等位基因总和的个体合并为一组,因为只有38个个体具有0个端粒长度缩短等位基因。

死亡终点

我们使用丹麦中央人事登记处获取2013年4月23日之前死亡的所有参与者的死亡日期。全因死亡定义为任何死亡,不论死因。没有参与者失去了后续行动,那些移民(n = 286)在移民之日被审查。

我们进一步使用丹麦国家死因登记册根据死亡原因对所有死亡进行分类,该登记册基于医院主治医生报告的死亡证明信息或在丹麦人死亡时的全科医生报告的死亡证明信息。我们使用 ICD-8和 ICD-10诊断将所有死亡分类为癌症死亡率、心血管死亡率和其他原因引起的死亡。在丹麦,可以在死亡证明上列出最多三种死因,一些与会者的死因不止一种。因此,癌症、心血管疾病和其他原因造成的死亡总数超过了死亡总数。2011年12月31日之后死亡原因不详,此日期之后的1184例死亡被归类为未指明的死因。

协变量

所有的基线特征被记录下来,或者从检查当天收集的数据中得出,这些数据基于自填问卷、体格检查和血液样本。我们根据先前的研究选择了协变量,表明这些变量最有可能导致死亡率(31)。体重指数由测量体重(kg)除以身高平方(m2)计算。在体格检查时测量收缩压。吸烟状况、每周酒精摄入量(12g 酒精 ~ 1单位)和体力活动水平均自我报告。包年,即一年中每天消耗20支香烟或相当于20支的香烟,是根据有关当前和过去吸烟习惯问题的信息计算出来的。标准医院比色法测定血浆总胆固醇(mmol/L)。对于多变量调整,根据年龄和性别(< 1%)估算缺失的连续值,并将缺失的分类值分配到缺失类别(< 0.5%)。

统计分析

我们使用的是 Stata 版本12.0(StataCorp,College Station,TX)。所有的统计学检验都是双侧的。除非进行多重比较,否则显著性水平的 P 值小于0.05,在这种情况下,我们使用邦弗朗尼校正。对于趋势测试,根据编码为1至10的端粒长度减少(第一个十分位数由具有最长端粒的个体组成)或根据编码为1至6的等位基因和(第一组代表具有最长端粒的遗传易感性的个体) ,将个体分为研究特定的十分位数。

关联分析

我们使用 Cox 回归分析。对于这些分析,随访开始于检查和血液采样,结束于死亡、移民或2013年4月23日,以先到者为准。多变量模型调整了年龄,性别,体重指数,收缩压,吸烟状况,烟草消费,酒精消费,体力活动和胆固醇水平。我们根据端粒长度十分位数评估风险,并以端粒长度最长的十分位数组作为参照组。我们使用 Schoenfeld 残差评估了比例风险假设; 没有观察到重大违规。所有的统计学检验都是双侧的。

基因分析

对于 Cox 回归模型,我们还检查了在连续尺度上每200碱基对端粒长度减少的风险。这个任意的选择代表了大约10年的增长年龄(4,6) ,因此,预计将推断出相当大的增加死亡率。我们在未经调整的 Cox 回归分析中,根据等位基因总和以及三个 SNP 的每个等位基因检查了死亡率。基因决定的200碱基对端粒长度减少的死亡率的比值比是通过使用两阶段工具变量的控制函数估计器进行的回归分析分析得出的(32)。第一阶段是将等位基因和作为端粒长度的连续工具的线性回归。第二阶段是端粒长度对死亡率的预测值(包括第二阶段 Logit模型中第一阶段线性回归的估计残余 Logit模型)。第一阶段回归分析产生的部分 R 平方为0.005,F 值为342,F 值大于10表示遗传资料具有足够的统计强度,可用作工具(33)。图1进一步描述了这种孟德尔随机化设计。

敏感性分析

我们通过 Fine 和 Gray (34)的方法计算亚风险比来计算死亡风险,使用非癌症死亡率作为癌症死亡率的竞争事件,非心血管死亡率作为心血管死亡率的竞争事件,癌症和心血管死亡率作为其他原因导致死亡的竞争事件; 参与者仅随访至2011年12月31日。对于分层分析,我们测试了相互作用的似然比检验,比较了主效应模型与模型也包括一个双因素相互作用项。

结果

在这个来自一般人群的64637个个体的样本中,端粒长度每年增加17.4个碱基对(95% 的置信区间[ CI ] = 17.0至17.8)(P < 1 * 10-300)(补充图2,可在线获得)。减少端粒长度十分位数与所有潜在混杂因素有统计学显著相关(表1)。值得注意的是,等位基因总和与任何混杂因素无关(表1; 补充表2,可在线获得)。

共有7607人(12%)在随访期间死亡; 2420人患有癌症,2633人死于心血管疾病。中位随访时间为7年(范围 = 0至22年)。在年龄调整分析中,端粒长度减少十分位数与全因死亡率增加有关(P 趋势 = 3 * 10-30) ,在多变量调整后减弱(P 趋势 = 2 * 10-15)(图2)。对于第十个(端粒长度最短)与第一个十分位数的个体,多变量调整后的死亡风险比为1.40(95% CI = 1.25-1.57)。癌症死亡率、心血管死亡率、其他原因引起的死亡和未明确的死亡原因的结果相似(补充表3,可在线获得)。

当分析总和(PTrends = 1 * 10-104)(图3)和三个单个 SNP 中的每一个(补充表4,在线可获得)时,端粒随着等位基因数量的增加而缩短; 平均每个等位基因减少69个碱基对(95% CI = 61至76)。

在 Cox 回归模型中,对于组合等位基因总和,癌症死亡率的每个等位基因风险比为0.95(95% CI = 0.91至0.99) ,rs2487999(OBFC1)为0.90(95% CI = 0.90至1.02) ,rs7726159(TERT)为0.96(95% CI = 0.90至1.03) ,rs1317082(TERC)为0.96(95% CI = 0.90至1.03)(图4)。无论是等位基因总和还是三个单独的 SNPs 都与心血管死亡率、其他原因引起的死亡、未明确的死亡原因或全因死亡率无关。三个 SNP 的不同组合产生了相似的结果(补充表5,可在线获得)。

在多变量调整的观察性分析中,200碱基对较短端粒长度的癌症死亡风险比为1.02(95% CI = 1.01至1.03)(图5)。心血管死亡率、其他原因引起的死亡、未明确的死亡原因和全因死亡率的观察性分析结果相似。相比之下,基因决定的端粒长度的200碱基对减少与癌症死亡率降低有关(比值比 = 0.86,95% CI = 0.76-0.96)(图5) ,但与心血管死亡率,其他原因导致的死亡,未指定的死亡原因或全因死亡率。

当我们考虑到来自其他原因的死亡风险时,特定原因死亡率的结果仍然相似(补充图3,可在线获得)。此外,当我们只考虑每个人的一个死亡原因时,结果是相似的(结果未显示)。

在根据人口,年龄,性别,体重指数,收缩压,吸烟状况,饮酒,体力活动水平和胆固醇水平对200碱基对端粒长度减少的癌症死亡率进行分层多变量调整的观察分析中,我们没有发现相互作用的证据(补充图4,可在线获得)。在类似的分层遗传学分析中,癌症死亡率的所有比值比大大低于1,我们没有发现相互作用的证据。

讨论

在这项对64637名普通人群的研究中,我们已经证实(11,20,35)和重复(4,17)以前的发现短端粒与高死亡率(包括癌症死亡率)之间的观察性关联。此外,与此相反,我们发现基因短端粒与低癌症死亡率有关,但与低心血管死亡率、其他原因死亡或全因死亡率无关。这意味着基因长端粒与癌症死亡率增加有关。这是一个新奇的发现。补充图5(可在线获得)总结了我们对癌症和全因死亡率的结果。

尽管出乎意料,但是当我们考虑端粒缩短和维持的生物学时,我们看似矛盾的发现可能就不那么令人困惑了。端粒短以及癌症死亡率已被证明与年龄增长、男性、吸烟、肥胖和几种与年龄相关的疾病有关(3,16)。因此,观察结果可以用独立导致端粒缩短和癌症死亡率增加的共同因素来解释,而没有短的端粒长度本身介导增加的死亡率。因此,观测分析很可能是混淆的。相反,长端粒的遗传倾向可能通过增加某些细胞类型的端粒长度维持来影响癌症死亡率,否则这些细胞类型将经历衰老和凋亡。本研究中检测的所有三种基因型都与端粒生物学有关: 其中两种可能通过端粒酶的 TERT 和 TERC 组分,第三种可能通过调节端粒酶活性的 CST 复合物。端粒的维持对于肿瘤的长期发展至关重要,因为端粒酶活性在正常体细胞中通常较低或不存在,已经在大多数类型的人类癌症中发现(2,14)。因此,我们的研究可能表明,在端粒缩短等位基因很少的个体中产生的癌细胞可能继承了这个个体良好的端粒维持能力,因此,这个具有基因长端粒的个体将具有增加的癌症死亡率,仅仅因为癌细胞不断分裂和癌症生长更多,最终导致患者死亡。在我们的观察和遗传分析中,这种关联的相反方向可以与发现的用于预防早期死亡的抗氧化剂补充剂进行比较。基于动物模型和观察性研究,抗氧化剂补充剂长期以来被认为具有延长生命的作用,但包括大型 Cochrane 综述在内的随机试验发现没有证据支持这种作用(36)。事实上,β-胡萝卜素和维生素 E 补充剂似乎会增加死亡率。

在图1的图例中列出的孟德尔随机化研究的假设似乎在这项研究中得到了满足。假设1: 用作遗传工具的等位基因和是由三个 SNP 构建的,即使在使用另一种端粒长度测量技术的其他研究中,这些 SNP 也与端粒长度高度相关(23,25)。它们位于三个不同的染色体上,因此不太可能有遗传联系。这意味着,当把等位基因的数量加在一起时,三种基因型中的每一种的效应可能只计算一次。此外,这三个基因都编码涉及端粒酶活性和端粒维持的复合物的已知和重要组成部分。虽然该仪器只能解释端粒长度变化的0.5% ,但它的 F 值非常高,为342。假设2: 我们没有发现任何迹象表明等位基因总和和混杂因素之间存在关联。假设3: 等位基因和应该只通过端粒长度影响死亡率。虽然 TERT 中的一些 SNP 最近被报道与不同癌症的风险相关(30,37) ,但这里使用的 rs7726159 SNP 在这些 SNP 中并不是独立的。

我们研究的优势包括64637名个体的大样本量,其中包括2013年4月23日之前死亡的所有个体的死亡日期的准确信息,这使得全因死亡率的随访长达22年。我们的研究还有一些固有的局限性,这些局限性与应用方法有关,包括使用死亡原因登记册,该登记册不仅仅依赖于尸检结果,而是基于主治医师的判断。然而,一个不准确确定的死亡原因会倾向于将结果拉向无效假设,因此不太可能解释我们关于癌症死亡率的发现。全因死亡登记是非常可靠的,因为丹麦法律规定必须进行登记,因此被认为是100% 完成的。

目前还没有标准的校准器,因此,端粒长度测量没有明确的可追溯性(3,38)。我们使用定量 PCR 来测量端粒长度,因为这是像我们这样的大规模研究的唯一实用方法。与第一种测量端粒长度的方法SB法比较,定量 PCR 测量的是与二倍体基因组相关的 TTAGGG 重复序列的平均累积量,而不是端粒本身的长度。由于WB法通常测量含有 TTAGGG 重复序列(包括亚端粒片段)的片段的平均值和分布,这两种方法不能直接比较,两种方法之间的 r2相关性根据出版物的不同而变化,从36% 到大于80% (38)。然而,我们的单中心端粒长度测量具有较低的不精确性,并且显示出与年龄预期的非常强的相关性,P 值小于1 * 10-300。关于我们的端粒长度测量的另一个限制是,我们测量的是平均外周白细胞端粒长度,这可能不一定反映端粒长度的所有细胞的身体。然而,早期的研究表明,白细胞端粒长度与其他细胞类型的端粒长度相关(39)。

不可否认,选择200个碱基对的端粒缩短是任意的,也可能是20个碱基对或1000个碱基对。然而,由于端粒长度是一个连续的测量,任何其他缩短的选择只会改变估计的尺度,而不是 P 值。

总之,在关联分析中,外周血白细胞的短端粒与高死亡率有关。相比之下,基因决定的短端粒与低癌症死亡率有关,但与全因死亡率无关。这意味着基因决定的长端粒与高癌症死亡率有关。我们推测,长端粒可能代表了癌细胞的生存优势,允许多个细胞分裂导致高癌症死亡率。

参考

资源下载: