摄氧平台——对经常被误解的现象的评论
The Oxygen Uptake Plateau—A Critical Review of the Frequently
Misunderstood Phenomenon
Max Niemeyer;Raphael Knaier;Ralph Beneke
摘要
剧烈运动时摄氧量与做功率关系趋于平缓表明达到了最大摄氧量 (VO2 max)。不幸的是,并未在所有参与者中发现 VO2 max 的明显平稳期 (VO2pl)。这项调查的目的是批判性地审查研究方法和生理因素对 VO2pl 发生率的影响。结果表明,许多研究使用了不恰当的定义或有条不紊的方法来检查 VO2pl 的发生。与广泛的假设相反,尚不清楚(上坡)跑步是否比骑自行车运动或不连续运动比连续增量运动测试有更高的 VO2pl 发生率。此外,大多数评估超最大验证阶段有效性的研究都报告了验证回合的持续时间,这些持续时间太短,无法确保所有参与者都达到最大摄氧量。因此,几乎没有证据表明,当增量试验辅以超最大验证回合时,VO2pl的发生率较高,并且对最大摄氧量的诊断具有相应的优势。初步证据表明,在连续递增试验中,VO2pl的出现是由生理因素决定的,如无氧能力、VO2动力学和亚最大强度范围内代谢物的积累。随后的研究应更多地关注有效的VO2pl定义的使用,这需要在次最大VO2增加的约50%和相当大的采样间隔时进行截断。此外,如果使用验证回合来验证VO2peak/VO2 max的实现,则应确保它们可以持续足够长的时间。
关键点
u 尽管进一步提高了工作速度,但如果̇VO2接近稳定(=̇VO2pl),则表明达到了̇VO2最大值;然而,并非所有参与者在增量测试结束时都会出现̇VO2pl。
u 没有令人信服的证据表明,̇VO2pl的发生率受运动模式、运动方案、有氧健身、人体测量或年龄的影响。
u 初步证据表明,快速的̇VO2-动力学以及与̇VO2最大值有关的高无氧能力和无氧阈值似乎会增加在̇VO2最大值处出现平台的机会。
1引言
对摄氧量平台(̇VO2pl)的首次描述归功于阿奇博尔德-维维安-希尔。这位前诺贝尔奖获得者和他的同事哈特利-鲁普顿在平坦的地形上以不同的跑步速度跑步时用道格拉斯袋收集他们的呼吸气体。在一个参与者中,他们发现̇VO2随着跑步速度的增加而增加,但在超过每分钟260米的速度时保持不变。Hill和Lupton将V̇O2-跑速关系的平坦化解释为表明已经达到了最大摄氧量(̇VO2 max)。在随后的研究中,如图1所示,在严重强度领域,̇VO2-跑速-关系或-工作-速率-关系的平坦化被称为”̇VO2-平台 “或 “平坦化”。如今,̇VO2最大值被认为是运动生理学和运动医学中最重要的测量方法之一。然而,人们常常忽视的是,只有当̇VO2在工作速度增加的情况下仍保持大致不变时,才能确定已经达到了̇VO2最大值。因此,正如Poole和Jones所强调的那样,诊断̇VO2最大值需要–定义–̇VO2pl,无论平台发生在连续增量测试的最后阶段、不连续测试的最后阶段之间或增量测试与后续验证测试之间(见第2.3节)。
不幸的是,在接受运动测试的参与者中,只有一小部分人显示出̇VO2pl。即使在有50名以上参与者的大型研究中,报告的发生率也在17%到94%之间,特别是取决于所使用的̇VO2pl定义(见第2.1节)。这导致了在过去三十年中对̇VO2 max的概念和诊断的广泛讨论。本调查的目的是对现有的关于̇VO2pl和̇VO2 max诊断方面的文献进行批判性回顾,特别是关于̇VO2pl发生率的方法和生理决定因素。
2 方法上的决定因素
尽管近一个世纪前就有了首次描述,但对于V̇O2pl现象的方法学决定因素和正确诊断仍有很多困惑。这导致了一种假设,即̇VO2pl是一种计算的假象,而不是一种生理事件的指示。相反,其他作者提出,没有̇VO2pl主要是由于不适当的运动模式和方案或数据分析方法造成的。下面将对数据分析方法、运动模式和方案对V̇O2pl发生率的潜在影响进行严格审查。
2.1 平台的定义
Taylor等人提供了第一个诊断̇VO2pl的定量方法。他们在跑步机上以3.13米/秒的速度进行了持续3分钟的不连续运动测试。在随后的测试日里,跑步机的倾斜度从测试到测试增加了2.5%。当随后的测试日之间̇VO2的增加小于150毫升/分钟(~ 2.1毫升/分钟/公斤-1)时,就假定̇VO2pl。这个分界线是根据亚最大强度领域的相应跑步机测试确定的,即在13名参与者的子组中,在发生̇VO2pl之前有两个或更多的步骤。他们发现,每走2.5%的台阶,̇VO2平均增加299.3±86.5毫升/分钟(约4.2±1.1毫升/公斤),范围为159-470毫升/分钟(约2.2-5.9毫升/公斤)。基于这一发现,作者得出结论,如果̇VO2的增加小于150毫升/分钟-1或2.1毫升/分钟-1公斤-1:”……在决定达到最大摄氧量时出现错误的可能性很小”。
Taylor等人的临界值仍被广泛用于̇VO2pl的诊断,尽管这一假设在随后的研究中受到了质疑(见第2.3.2节)。但更重要的是,这些临界值只在特定的测试条件下得到了验证。它们是从一个不连续的运动方案中推导出来的,其恒定的跑步速度足以反映出稳态̇VO2-动力学的完整的快速成分,以及随后每一次跑步的具体需氧量增加。在各种一次性连续增量测试中,其他人没有采用这种高度具体的测试条件,而是将Taylor等人的截止时间与任意的时间间隔(也称为采样间隔)结合起来,而不考虑测试特定的̇VO2反应。这样的修改可能会导致Taylor等人所暗示的推测与使用其他测试方案引起的每次或工作量增加的特定测试的̇VO2增加之间不匹配。例如,广泛使用30秒的采样间隔来检查是否发生̇VO2pl。这意味着要比较测试的最后一个和接下来的最后一个30秒的平均̇VO2。在增速为30W/min-1的斜坡测试中,相邻的30s采样间隔之间的平均功率差异为15W,导致在亚最大强度领域相邻的采样间隔之间的平均̇VO2增加约为150mL min-1。在这里,应用Taylor等人的150 mL min-1的截止值可能会导致̇VO2pl的诊断,尽管在̇VO2最大值处没有发生平坦化。因此,正如Beltrami等人和Marsh所描述的那样,在任意选择的测试方案和时间间隔上应用这种固定的或绝对的截止点可能会引起错误的̇VO2pl诊断的高风险。为了避免这种不匹配,强烈建议采用相对截止值,即考虑特定测试方案中亚最大强度领域的̇VO2的增加。然而,即使在使用相对截止值时,Beltrami等人也发现在亚最大强度域有几个̇VO2pl’s。基于这一发现,他们得出结论,̇VO2pl可能反映了一个计算伪数,而不是一个真正生理事件的指示。
在数学上,平台被定义为斜率等于零的函数的一部分。然而,逐次呼吸的̇VO2反应显示出很大的变异性,这主要是由通气速度和深度的不规则性引起的。因此,即使在稳态条件下,后续采样间隔的̇VO2值也不会完全相似(即斜率≠0),正如Myers等人所显示的那样。因此,如果将截止值设定为斜率等于0,那么由于身体运输和利用O2的限制而引起的潜在的̇VO2pl可能仍然无法检测到(假阴性的̇VO2pl诊断)。为了避免这种假阴性的̇VO2pl诊断,必须将截止值设定在一个高于通气引起的̇VO2变异性的斜率或数值上。
另一方面,如图2所示,̇VO2的变异性可能导致在增量运动测试的亚最大强度领域出现平台样̇VO2反应。如果图2所示的测试提前结束,例如,由于缺乏动力或疼痛耐受性,在285W的工作速率下,这种平台状的̇VO2反应可能导致错误的平缓诊断。为了能够区分单纯由通气变化引起的平台(假阳性̇VO2pl’s)和由身体运输或利用O2的限制引起的平台(真̇VO2pl’s),在̇VO2 max的平台必须比发生在亚最大强度领域的潜在平台更加明显。
为了减少假阳性̇VO2pl诊断的风险,一些研究采用了相当严格的分界线,这些分界线被设定为大大低于亚最大强度领域中̇VO2平均增加或差异的50%。由于̇VO2的变异性呈高斯分布,而且这种限制性的截止值可能比普通的逐次呼吸设备的准确性还要低,这种方法增加了假阴性的̇VO2pl诊断的风险。根据最近一项研究的数据,这一点变得很清楚。作者确定了在增量为30W min-1的斜坡测试中,不同工作率定义的采样间隔的假阳性和假阴性̇VO2pl诊断的风险。他们从30W(=60秒)的采样间隔开始,这意味着在亚最大强度领域的不同30W间隔中拟合了几个斜率,以检查假阳性诊断的比率/风险。在这个采样间隔中,假阳性诊断的风险是12.7%。由于斜率的变化是高斯分布的,因此可以计算出,如果在亚最大强度领域将截止点设置为̇VO2增加的一半,则假阴性诊断的风险也为12.7%。如果将分界线设定为亚最大强度领域中̇VO2增加量的三分之一,则假阳性̇VO2pl诊断的风险降低到6.4%。然而,与此同时,假阴性̇VO2pl诊断的风险更明显地增加到22.4%,这样,假阳性和假阴性̇VO2pl诊断的综合风险比设置在增加的一半的截止值略高(28.8% vs. 25.4%)。这表明,在亚最大强度领域,分界线应设置在增加量的一半左右,以使假阳性和假阴性的̇VO2pl诊断的风险相等。
然而,假̇VO2pl诊断的综合风险约为25%,相当高,不允许以足够的确定性检测真正的̇VO2pl。因此,采样间隔后来增加到40(=80秒)和50W(=100秒),这使得假阳性和假阴性̇VO2pl的综合风险降低到~9.4(40W)和~3.2%(50W)。将后一种̇VO2pl定义应用于斜坡试验的最后50W增量,检测出的̇VO2pl发生率(35.7%)大大高于由于̇VO2的变化而导致的假阳性̇VO2pl的预期比率(1.6%)。这表明在̇VO2最大时存在一个̇VO2pl,即VO2/P比率的真正变化,而不是像一些研究者所认为的那样,仅仅是由通气量的变化或计算的假象造成的。然而,在Niemeyer等人的研究中观察到的最大强度下的̇VO2pl发生率约为35%,远远低于偶尔报道的90-100%的相应发生率。由于后者的研究使用了很短的取样间隔,加上不恰当的绝对分界线,这些极高的̇VO2pl发生率可能反映了高比例的假阳性̇VO2pl诊断。因此,认为没有̇VO2pl是由不恰当的平台定义和/或不充分的数据分析方法造成的假设似乎是没有根据的。如果使用更合适的̇VO2pl定义,V̇O2pl的发生率约为20-60%似乎是现实的。
就上述写法而言,适当的̇VO2pl定义要求(1)在特定测试方案的亚最大强度领域中,将截止点设定在大约50%的̇VO2增加值;(2)使用相当大的采样间隔来检查是否出现̇VO2pl。对于增速为30±10 W min-1的斜坡运动测试,大约40-50 W的采样间隔似乎是理想的。这意味着在增量运动测试的最后40-50W期间,̇VO2的增加必须小于亚最大强度领域的增加的一半,才能确定真正的̇VO2pl平台发生。重要的是,正如Niemeyer等人所强调的那样,这种方法不能转移到增量率低得多的增量测试中,这些测试通常适用于久坐或临床人群。
因此,不可能充分肯定地评估与本综述有关的所有已发表研究的平台定义的有效性。这也适用于没有报告采样间隔或增量率的研究。因此,我们选择不排除那些使用有效性不明确的̇VO2pl定义的研究。相反,我们在随后的章节中讨论了所使用的̇VO2pl定义对相应结果的潜在影响。使用较大取样间隔(即̇VO2pl由超过最后30W或60s的时间确定)和适当截止点的研究被列为 “可能有效”。当分界线来自于亚最大强度领域的̇VO2的增加,或设置在亚最大强度领域的̇VO2的预期增加的大约一半时,就认为分界线是适当的。
2.2 练习模式
众所周知,̇VO2最大值∕̇VO2峰值在不同的运动模式下是不同的。未受过训练或未受过专门训练的参与者在上坡跑步时达到的最大氧饱和度∕ ̇VO2peak比骑自行车或其他运动模式高5-15%。只有经过专门训练的运动员才可能在其习惯的运动项目中达到比(上坡)跑步更高的或相当的̇VO2最大值∕̇VO2峰值。基于这样的假设:̇VO2pl只发生在参与者在完全符合其能力的模式下所能达到的最高摄氧量(=̇VO2 max),人们普遍认为,与其他运动模式相比,在(上坡)跑步或专门训练的学科中,̇VO2pl发生率更高。然而,只有两项研究根据受试者内部设计分析了不同运动模式下的̇VO2pl发生率。这两项研究都描述了上坡跑步(约50%)的̇VO2pl发生率明显高于自行车运动(分别为8%和20%)。然而,这两项研究都使用了诊断̇VO2pl的绝对截止值,没有考虑到运动模式和特定测试方案之间̇VO2的不同增长。例如,Gordon等人使用0.5 W s-1的增量速率进行骑行,导致亚最大强度领域的̇VO2在连续的30s采样间隔之间增加,大约为150 mL min-1。相比之下,在跑步机测试中,以10公里/小时的跑步速度,每30秒间隔0.5%的递增率导致连续30秒采样间隔之间̇VO2的增加约为~ 60毫升/分钟。由于两种运动模式的临界值都设定为50 mL min-1,因此与自行车测试相比,在跑步机上出现假阳性̇VO2pl诊断的风险高得多。类似的问题也适用于Rivera-Brown等人的研究。因此,根据目前的证据,尚不清楚(上坡)跑步的̇VO2pl发生率是否真的比其他运动模式高。
尽管如此,事实证明,尽管在跑步机或腿部和手臂联合骑行测试中,参与者可能在增量骑行测试结束时表现出明显的̇VO2pl,但其最大̇VO2较高。因此,̇VO2pl只表明达到了特定模式或任务的̇VO2最大值,而不是达到了参与者在大部分骨骼肌被激活和/或运动模式与训练特异性相一致时所能达到的最高摄氧率。
2.3 运动方案
2.3.1 运动时间和增量速率
在一些研究中已经观察到不同的增量速率和由此产生的耗竭时间对̇VO2最大值∕̇VO2峰值的影响。其中一些研究表明,̇VO2最大值∕̇VO2峰值可以在大约5到25分钟之间的增速范围内测量,从而导致耗尽。然而,其他研究表明,应使用增量速率,导致在8至12或16分钟之间耗尽。据我们所知,只有一项研究采用了主体内设计,检查了递增率对̇VO2pl发生率的影响。在这项研究中,对16名训练有素的参与者(8名男性和8名女性)采用了15至90W min-1的递增率,以完成大约5、8、12和16分钟的坡道测试。作者没有发现测试持续时间或相关增量对̇VO2pl的发生率有任何系统性的影响。̇VO2pl的最高发生率是在持续时间为8和16分钟的斜坡测试中发现的。不幸的是,作者将̇VO2pl定义为在最后30秒内̇VO2的增加<50 mL min-1,而忽略了在不同的方案中,亚最大强度领域的̇VO2的预期增加范围为75 mL min-1至450 mL min-1。因此,在那些增量较低的方案中,假阳性̇VO2pl诊断的风险要高得多(见2.1节)。
使用高增速或低增速的研究结果表明,̇VO2pl发生在广泛的增速和相应的测试时间范围内。因此,据报道,在增量测试中,̇VO2pl在约8分钟内,但也在约24分钟内导致疲惫。这表明,̇VO2pl发生在相同的增量速率和相应的测试时间范围内,这使得̇VO2最大值得以实现。然而,需要使用适当的平台定义进行进一步的研究,以验证是否有一个最佳的增量速率或测试时间来实现̇VO2pl的发生。
2.3.2 连续运动与非连续运动
早期的研究使用不连续的运动测试来测量̇VO2最大值。如图3所示,不连续试验的特点是有几个不连续的恒定负荷运动,其间有很长的休息时间(即几个小时或几天)。在以前用于测量̇VO2最大值的不连续协议的应用中,恒定负荷训练的强度不断增加,直到̇VO2的相应增加低于预定的截止值,或直到工作速率不能维持预定的时间。由于其耗时的性质和测量设备的改进,不连续的方案已经被连续增量运动方案所取代。
正如一些研究显示的那样,̇VO2最大值∕̇VO2峰值在不连续的和连续的运动测试之间没有区别。然而,与Taylor等人使用的不连续测试方案相比,在大多数使用连续测试的研究中,̇VO2pl的发生率要低得多。这导致了这样的假设:与不连续的运动测试相比,连续的运动测试中̇VO2pl的发生率要低。据我们所知,目前只有一项研究采用受试者内部设计,比较了连续和非连续运动测试的̇VO2pl发生率。在这项研究中,Taylor等人的原始非连续运动方案和每分钟增加2.5%跑步机坡度的连续增量跑步机试验被用来测量̇VO2最大值。与Taylor等人的研究相反,Duncan等人不仅增加了跑步机的等级,直到随后的跑步机等级之间̇VO2的增加<2.1 mL min-1 kg-1,而且直到参与者无法维持3分钟的不连续运动。Duncan等人用Taylor等人定义的截止点分析了最后两个2.5%的等级,发现在不连续和连续测试中,̇VO2pl的发生率分别为60%和50%。但是,如果他们在连续2.5%的不连续步骤之间的̇VO2pl增加量小于Taylor等人实施的截止值时就接受̇VO2pl,则不连续测试中的̇VO2pl发生率为80%。这一发现得到了一项早期研究的支持,该研究表明Taylor等人的原始方法会导致一些假阳性的̇VO2pl诊断。另外,其他使用不连续运动测试的研究发现̇VO2pl的发生率远远低于Taylor等人的研究,然而这些数字都在连续测试研究的范围内。总之,没有令人信服的证据表明不连续运动测试的̇VO2pl发生率比连续运动测试高。Taylor等人描述的极高的̇VO2pl发生率可能是由该研究的特殊方法造成的,该方法可能会导致很高的̇VO2pl假阳性诊断率。由于唯一一项以主体内设计比较不连续和连续测试的̇VO2pl发生率的研究样本量相当小(n = 10),因此需要进一步研究以验证不连续和连续运动方案之间的̇VO2pl发生率是否不同。
2.3.3 连续和非连续演练的结合。验证阶段
基于低的̇VO2pl发生率和二次衰竭标准的有效性值得怀疑,一些研究人员强烈建议使用̇VO2最大验证测试/阶段。如图4所示,这种方法包括一个恒定负荷运动测试,该测试是在普通的连续增量负荷测试和恢复阶段之后进行的。如果增量阶段和验证阶段的̇VO2peak没有差异,尽管验证阶段的工作速率高于增量测试的最大工作速率,即超最大工作速率(与增量测试结束时的最大工作速率有关),则发生̇VO2pl,增量测试的̇VO2 max被认为是验证的。如果验证阶段的̇VO2peak高于增量试验的̇VO2peak,则没有发生̇VO2pl的迹象,增量试验的̇VO2 max被认为是伪造的。一些研究报告称,与增量测试的̇VO2peak值和随后的超大规模验证活动的̇VO2peak值之间的差异相比,单次增量测试的最后部分出现的平台现象相当低。
然而,除了验证训练的超高速工作率外,还有一个重要的前提条件,即根据增量阶段和验证阶段的结合来进行有效的̇VO2pl诊断。由于̇VO2-动力学相当缓慢,验证活动的时间必须足够长,以达到̇VO2最大值。根据Hill等人的研究,要使̇VO2上升到其最大值,极限运动试验的最小时间是2.3±0.3分钟。Caputo和Denadai的一项更详细的研究表明,在未受过训练和未受过专门训练的参与者中,分别需要至少3.5±0.5和2.8±0.5分钟的时间。相反,在受过专门耐力训练的运动员中,2.0±0.5分钟的持续时间足以使̇VO2上升到其最大值。这些最短的持续时间得到了̇VO2动力学研究的支持,这些研究表明,与非特异性或未受过训练的人相比,受过耐力训练的参与者的̇VO2动力学的时间常数要短得多。因此,为了在增量阶段和验证阶段之间构建一个真正的̇VO2pl,验证阵容的工作速率必须是超极限负荷,并且需要持续至少~2(训练过的)、~3(非特异性训练)或~3.5(未训练过的)分钟。由于之前的重度/剧烈运动会导致̇VO2动力学的加速,因此在增量测试后几分钟(最多30分钟)进行的核查训练中,似乎有可能平均稍早达到̇VO2最大值。然而,这些数字代表了相应组群的平均值,这意味着一些参与者需要更长的时间来达到最大氧饱和度。因此,这些时间应该被看作是绝对的最小值,即使验证过程是在一种启动的状态下进行的。
表1总结了已发表的增量率、̇VO2最大值和用尽时间(TTE)的研究,这些研究评估了超极限验证测试的使用,并报告了确切的TTE值。根据该表可以看出,在22项研究或子研究中,只有3项研究报告了足够长的验证过程的平均TTE值,以令人信服的概率达到最大VO2。报告最长的TTE的研究是在一组未受过训练的参与者中,在普通增量测试结束时,以105%的工作速率进行了一次超大规模的验证训练,恢复阶段至少为24小时。4.2 ± 2.0的TTE比所有其他骑行研究中以105%的速度进行验证的平均TTE高100%以上(见表1)。然而,验证阵容的TTE的大标准偏差表明,相当一部分参与者没有达到未受过训练的参与者所需的最小测试时间>3:30分钟。
表1 评估健康参与者超大规模VO2最大值验证测试有效性的研究或子研究的最重要发现摘要,按验证时间(TTE)排序。
另外两项报告了足够长的TTE平均值的研究是在跑步机上进行的。其中一项研究使用的是增量测试,增量速率相当低,与其他大多数研究相比,增量测试持续时间大一倍以上(23.9±2.1分钟)(见表1)。在增量测试中,可达到的最大工作速率或跑步速度与增量速率呈正相关。因此,以一定比例的最大工作速率或跑步速度进行的验证训练,其工作速率取决于前面的增量测试的增量速率。乍一看,这似乎支持使用低的增量速率来保证随后的验证训练能够持续足够长的时间。然而,这种好处也伴随着风险,即减少在增量阶段达到̇VO2最大值的机会,因为可能会超过̇VO2最大值测试的最佳时间。有趣的是,Sanchez-Otero等人的研究表明,尽管验证训练持续的时间足够长,但与增量测试相比,验证训练中的̇VO2峰值明显较低。这可能是由于训练有素的运动员在方波运动中不能通过快速成分̇VO2反应来达到̇VO2最大值的现象造成的,这进一步限制了超极大值验证测试增加̇VO2pl发生率的有效性。
然而,大多数其他研究报告称,在增量阶段和验证阶段,平均̇VO2peak-值相似(见表1)。然而,这并不表明每个参与者都达到了̇VO2pl和̇VO2最大值,下面的例子证明了这一点。Midgley等人没有发现增量测试和验证测试之间的平均̇VO2peak值有明显差异(表1)。对32次增量测试进行分析,只发现16个̇VO2pls。相比之下,32次增量测试中的26次的̇VO2最大值在验证过程中被一个并不高的̇VO2值(<2%)所验证,这表明增量测试和验证过程中的̇VO2pl发生率为81%。然而,他们没有考虑到,在26次阳性验证测试中的7次,̇VO2比增量测试的相应̇VO2峰值低3%以上。Midgley等人将这种较低的验证回合̇VO2值归因于验证回合持续时间不足。因此,目前还不清楚在相应的增量测试中是否达到了̇VO2最大值。当减去这七项测试时,32项增量测试中只有19项(59%)真正得到了验证,这与仅通过增量测试确定的̇VO2pl’s的数量(50%)相近。后面的例子加上表1中的大多数研究报告了更短的验证测试的TTE值,表明在确定̇VO2pl和̇VO2 max的过程中,超大规模验证测试比单一增量测试程序的优势相当有限。
与此相反,有研究表明,亚最大限度的验证训练(如最大工作率的95%)可能有助于确定增量测试的亚最大限度的̇VO2peak值,尤其是在久坐和临床人群中,但也包括娱乐活动参与者。然而,需要注意的是,亚最大限度的验证测试并不允许构建̇VO2pl,因为它被定义为尽管工作速度增加,但̇VO2大致保持不变。因此,当亚最大检验的̇VO2峰值与增量测试的̇VO2峰值相似时,我们不能肯定已经达到了̇VO2最大值。然而,如果亚最大验证训练的̇VO2峰值高于增量测试的̇VO2峰值,就可以肯定在增量阶段没有达到̇VO2最大值。此外,次最大限度的验证训练中较高的̇VO2峰值更接近于̇VO2最大值。因此,可以持续足够长的时间的亚最大验证训练似乎对诊断̇VO2peak有用,但对诊断̇VO2pl和̇VO2 max没有用。
3 生理上的决定因素
如前几节所述,̇VO2pl似乎很可能不是Beltrami等人和其他人所建议的那样,只是一个计算上的假象。然而,也没有令人信服的证据表明,缺乏̇VO2pl主要是由于不恰当的运动模式和方案或数据分析方法造成的。因此,无论采用何种运动模式和方案,在使用可能有效的平台定义时,大约有20-60%的参与者在̇VO2 max处显示出平台。这就提出了一个问题:为什么有些参与者表现出̇VO2pl,而其他参与者却没有。
3.1 为什么会出现̇VO2pl?
Hill和Lupton解释说,在高速跑步时,̇VO2与跑步速度的关系趋于平缓,这表明 “心脏、肺部、循环和氧气向活动肌纤维的扩散已经达到了最大活动量”。在随后发表的一篇文章中,他们认为心血管和呼吸系统运输氧气的能力是限制̇VO2最大值的主要因素。̇VO2pl反映了心血管和呼吸系统向肌肉运输O2的上限,这一假设得到了最近研究的支持。Brink-Elfegoun等人用Fick原则比较了在几乎没有引起̇VO2最大值的恒定负荷运动中和在高出10-15%的恒定工作率中的̇VO2和心输出量(CO)。尽管两个恒定负荷训练的工作率和持续时间不同,但他们发现在较高和较低工作率的训练中,最大氧活度和CO没有差异。这表明,在̇VO2最大值时,̇VO2-工作率关系变平是由于心脏无法进一步提高向肌肉输送O2的速率而造成。Brink-Elfegoun等人的发现得到了Miyamoto等人一项较早的研究的支持,该研究描述了CO和̇VO2开始趋于平稳的工作速率之间的密切关系。
Harms等人表明,在最大̇VO2时有相当大的动脉氧饱和度(≤92%)的女性参与者中,通过呼吸高氧空气(26% O2和74% N2)增加O2分压导致最大̇VO2的增加,并消除了常氧条件下存在的̇VO2pl。相反,没有或只有在̇VO2最大值时的轻微动脉O2脱饱和度(≥93%)的参与者在应用高氧空气时,̇VO2最大值没有增加。此外,他们在两种条件下都表现出̇VO2pl。
根据这些发现,̇VO2pl似乎很有可能是由于达到了身体可以运输(和利用)̇VO2的最高速率而造成的。这意味着真正的̇VO2pl是由限制̇VO2最大值的相同机制引起的,这一点仍有争议。然而,对于̇VO2pl的发生,如果̇VO2 max是由肺部的O2扩散、心血管系统的O2运输或肌肉的O2利用所限制,并不重要。̇VO2pl发生的关键因素是,在由于疲劳或低水平的疼痛耐受而终止运动之前,达到特定模式的最大ATP生成率(即̇VO2 max)。如第2.1节所述,̇VO2 max必须维持在相当大的工作速率的增加(约40-50W),以使̇VO2pl诊断具有足够的确定性。这就提出了一个问题:是什么样的能力使一些参与者在达到̇VO2最大值后还能忍受进一步增加工作速率或速度。
3.2 动机和疼痛容忍度
在重度和严重强度领域的运动伴随着不适和疼痛的感觉。因此,达到̇VO2pl被认为是一种高层次的动机和疼痛耐受力。事实上,一些研究(其中两项研究的̇VO2pl定义可能有效)报告说,̇VO2pl的发生伴随着更高的二级疲惫标准,如HRmax、RERmax和BLCmax。然而,其他大多数研究(其中三项研究采用了可能有效的̇VO2pl定义)报告说,在出现平台和未出现平台的参与者之间,次级耗竭标准没有显著差异。这表明,高水平的动机和疼痛容忍度只是达到̇VO2pl的必要条件,而不是充分条件。Doherty等人的研究支持了后一个结论,他们发现精英跑步者的̇VO2pl发生率相当低,尽管这个群体已经习惯了高强度运动所带来的不适和疼痛。
3.3 人体测量学、年龄和性别决定因素
人们普遍认为,与成人相比,儿童表现出̇VO2pl的可能性较小。如第2.3.2节所述,Taylor等人的研究中极高的̇VO2pl发生率很可能是由该研究的特殊方法引起的,该方法导致了较高的̇VO2pl假阳性诊断率。与采用可能有效的方法的研究相比,报告的儿童̇VO2pl发生率大多在成人参与者的范围内(即20-60%)。然而,据我们所知,没有一项研究直接比较儿童和成人的̇VO2pl发生率。比较有无̇VO2pl的年轻参与者的研究没有发现年龄上的差异。根据Edvardsen等人的研究,在一个由850多名成年参与者组成的大型队列中,年龄对̇VO2pl发生率也没有影响。重要的是,这些研究中有三项使用了不常见的̇VO2pl定义(尽管V̇E增加,但̇VO2没有增加)或固定的截止点,而没有报告相应的采样间隔。因此,目前还不清楚这些研究的结果是否有效。
除年龄外,一些研究还观察到身高、体重、体质指数和性别对̇VO2pl发生概率的影响。只有一项研究使用了可能不恰当的̇VO2pl定义,描述了女性成年人的̇VO2pl发生率明显高于男性。所有其他研究都没有发现身高、体重、体质指数和性别对̇VO2pl发生率的系统影响。尽管其中一些研究的̇VO2pl定义的有效性尚不清楚,但大量几乎一致的证据表明,̇VO2pl的发生率可能不受性别和人体测量的影响。相反,目前的证据不足以评估̇VO2pl的发生率在儿童和成人之间是否有差异或取决于年龄。
3.4 有氧健身和耐力训练
部分人认为,(耐力)训练的运动员更有可能在̇VO2max出现平台反应。这是基于这样的假设:运动员习惯于持续的高强度运动。然而,只有一项研究比较了受过耐力训练和未受过训练的参与者之间的̇VO2pl发生率。该研究报告称,与健康的久坐者(24%)相比,世界级自行车运动员的̇VO2pl发生率明显更高(47%)。相反,另一项关于精英跑步者的研究发现,在跑步机上进行的增量运动测试中,̇VO2pl的发生率相当低。此外,在大多数观察异质群体的̇VO2pl发生率的研究中,V̇O2pl的标志物与̇VO2max∕̇VO2peak没有关联。有的研究发现有无V̇O2pl的参与者之间的̇VO2max∕̇VO2peak没有差异,这一点得到了支持。此外,Gordon等人发现,与献血前的测试相比,献血后的̇VO2max明显降低,但V̇O2pl发生率相同。尽管这些研究中有些使用的̇VO2pl定义的有效性不明确或值得怀疑,但这表明̇VO2pl的发生可能与有氧健身无关。需要进一步的研究来验证习惯于高强度运动的耐力训练参与者是否比未受过训练的参与者有更高的̇VO2pl发生率。
3.5 无氧动力和能力
由于超过̇VO2max的能量需求必须由无氧三磷酸腺苷(ATP)生成来匹配,所以̇VO2pl的发生被归因于无氧功率和能力的差异。因此,一些研究观察了无氧测量对̇VO2pl发生的影响。其中大多数研究检查了̇VO2pl的发生是否取决于无氧功率或力量的测量,如跳跃高度、跑步冲刺成绩、等速伸膝/屈膝或30s Wingate测试的峰值功率。然而,增量运动测试的最大工作率似乎不太可能受到无氧功率的限制。因此,30秒温盖特测试或6秒冲刺测试的峰值功率要比增量测试的最大功率高2-4倍,而增量测试是用来测量̇VO2max。因此,这些研究都没有发现平台期和非平台期参与者之间的系统性差异,这并不令人惊讶。长时间维持̇VO2max的能力更可能受到无氧能力的影响,而不是无氧功率的影响,正如恒定负荷运动所显示的那样。
基于这些发现,Gordon等人首先检查了增量斜坡测试中̇VO2pl的发生是否取决于无氧能力。他们发现,在斜坡测试的最后一分钟,最大累积氧缺和̇VO2的增加之间存在明显的负相关,这表明无氧能力较高的参与者更有可能在̇VO2max出现平台。如图5所示,这可能是由于在增量运动中,由于̇VO2的滞后行为,会出现̇VO2亏损的持续积累的事实。̇VO2的不足必须由无氧能量的贡献来匹配。这导致了肌肉代谢物的积累,因此,当引起疲劳的代谢物达到最大可容忍的浓度时,运动就会终止。在给定的̇VO2-赤字积累和̇VO2max下,较高的无氧能力应能在增量运动测试中获得较高的最大工作速率。因此,在达到̇VO2max后,具有较高无氧能力的参与者能够容忍进一步增加工作率或速度,这可能导致̇VO2pl的发生,如图5所示。Keiller和Gordon最近的一项研究支持了这一点,该研究表明,̇VO2pl的发生与厌氧等位基因有关。
然而,这两项研究都使用了相当短的采样间隔(60秒或60次呼吸),加上固定的截止点,因此研究结果可能受到假阳性和/或假阴性̇VO2pl诊断风险升高的影响。此外,Silva等人最近的一项研究没有发现最大累积缺氧与̇VO2pl发生率的测量之间存在相关性。这表明̇VO2pl的发生并不完全受无氧能力的影响。
3.6 氧气吸收动力学
维持长时间高强度运动的能力还由̇VO2动力学决定。̇VO2-动力学被定义为有氧ATP生成适应运动强度变化的速度。̇VO2-动力学越快,运动开始时的̇VO2-赤字和相关的无氧代谢物的积累就越低。因此,更快的̇VO2-kinetics降低了̇VO2-deficit,节省了无氧能力,这导致了在持续或间歇运动中更高的运动耐力和耗尽时间。此外,与具有较慢的̇VO2-动力学的参与者相比,具有较快的̇VO2-动力学的参与者更早达到其̇VO2最大值。
最近描述了̇VO2-动力学对̇VO2pl发生的影响。这项研究表明,患有̇VO2pl的参与者具有更快的斜坡和方波V̇O2动力学。如图6所示,较快的̇VO2动力学导致在亚最大强度领域较低的̇VO2赤字积累,并导致较早达到̇VO2最大值。因此,具有更快的̇VO2动力学的参与者能够在更长的时间内维持其̇VO2max,这增加了在斜坡测试结束时发生̇VO2pl的机会。
由于̇VO2-动力学会因重度/严重强度领域的引爆运动而加速,这一发现似乎得到了一项研究的支持,该研究显示,与未引爆的斜坡测试相比,在引爆状态下进行的斜坡测试中,̇VO2pl的发生率从50%增加到100%。然而,作者在检查̇VO2pl的发生时使用了一个不恰当的截止点,这可能导致̇VO2pl的高假阳性诊断率。此外,随后的一项研究也没有发现,与未进行坡道测试的情况相比,已进行坡道测试的̇VO2pl发生率更高。由于后一项研究发现坡道测试的̇VO2-kinetics也没有加速,这一发现既不支持也不否定̇VO2-kinetics对̇VO2pl发生率的潜在影响。
总之,对有和没有̇VO2pl的参与者进行比较的证据表明,̇VO2动力学是决定̇VO2平台发生的一个因素。然而,这种因果关系需要通过实验研究设计来证明,例如导致̇VO2斜坡测试动力学的加速,如引爆运动或饮食中的硝酸盐补充。
3.7 厌氧代谢物的积累
另一个被认为是决定持续高强度运动能力的因素是乳酸开始积累的工作速度与引起̇VO2max的工作速度的关系。以%̇VO2max表示的乳酸/通气阈值与引起̇VO2max的最小跑速时的耗竭时间之间的显著负相关关系支持了这一假设。
Lacour等人回顾性地分析了94名精英桨手的逐步递增测试的血乳酸和̇VO2值。他们发现̇VO2pl组在亚最大强度领域的血乳酸值明显较低。因此,与非平台组相比,平台组的4 mmol L-1乳酸阈值发生在̇VO2max的百分比上,明显高于非平台组。此外,乳酸阈值的百分比̇VO2max与首先引起̇VO2max的工作速率步骤中的血液乳酸浓度密切负相关。这似乎表明,具有̇VO2pl的桨手能够在更大程度上释放他们的无氧能力,因为与非plateauing桨手相比,他们有更高的无氧阈值(以%̇VO2max表示)。无氧能力的疏导似乎使̇VO2pl组在达到̇VO2max后能够容忍更大的工作速率的增加,这导致了̇VO2pl的发生。
3.8 中枢控制
基于低̇VO2pl的发生率,Noakes[20, 24, 33]对通过有氧和无氧ATP生成提供能量来限制̇VO2max和运动表现提出质疑。相反,他提出了一个模型,其中大脑(中央调控者)调节运动单元的招募,以防止由于O2缺乏或失去平衡而造成器官的损害。关于中央调控器模型的有效性的广泛但似乎没有结论的讨论超出了本评论的范围。有兴趣的读者可以参考大量的,但显然不完整的相关出版物。
然而,诺克斯反复指出,在没有̇VO2pl的情况下,增量运动的终止不能用无氧代谢物的积累(肌肉厌氧)来解释。他强烈表示,20多年来,传统的运动生理学概念未能回答以下关键问题。是什么原因导致在没有 “平台现象 “的情况下达到 “真正的”̇VO2max时终止运动?基于这个被认为没有答案的问题,他得出结论:…… “在大多数̇VO2max测试中没有’平台现象’,从逻辑上讲只能有一种解释:在大多数̇VO2max测试中,除了心输出量受限和骨骼肌厌氧的发展外,其他因素必须导致运动的终止。这一结论是基于这样的假设:”没有平台表明在最大运动中肌肉氧合充分”,只要不发生̇VO2pl,就可以排除任何形式的氧不足积累,也可以排除净无氧能量贡献。
然而,认为没有̇VO2pl表明肌肉氧合本身是充分的,不需要肌肉无氧能量供应的假设反映了对能量代谢的误解。如前文所述,由于̇VO2的滞后行为,从增量运动测试开始,就会出现O2不足的持续积累。此外,当工作速度超过最大乳酸稳态或临界功率时,代谢能量部分由无氧ATP生成提供,这导致了无氧代谢物的积累和肌肉疲劳。因此,尽管没有̇VO2pl,增量运动的终止可以很好地解释为̇VO2-赤字的积累、无氧能量的贡献和由此产生的无氧代谢物的积累。没有必要用中央管理机构来解释̇VO2pl的存在或不存在。
4 诊断̇VO2max的结论
如介绍部分所述,只有当̇VO2在工作速度增加的情况下仍保持大致不变时,才能确定已经达到了̇VO2最大值。因此,诊断̇VO2max需要–按照定义–̇VO2pl。然而,以前的研究在方法和数据处理上的不一致导致对̇VO2pl的正确诊断产生了很多困惑。当使用适当的̇VO2pl定义和方法时,增量运动测试中̇VO2pl的发生率通常低于60%(见第2.1节)。此外,没有令人信服的证据表明,在增量测试中辅以超大规模的验证测试或进行经典的不连续运动测试时,大多数参与者会出现̇VO2pl(见第2.3.2和2.3.3节)。这意味着根据目前的证据,在相当一部分参与者中,̇VO2max不能被诊断出来。由于这往往适用于50%以上的参与者,因此排除所有没有̇VO2pl的参与者似乎是不合理的。因此,我们必须接受̇VOpeak的诊断,至少在有更多的证据表明大多数参与者通过应用特定的方法达到̇VO2pl之前。
然而,即使不能诊断出̇VO2max,重要的是̇VOpeak等于或至少接近于̇VO2max。否则,就不能充分肯定地评估训练干预措施的效率。此外,如果̇VOpeak大大低于̇VO2max,可能会导致致命的误诊,因为̇VOpeak是临床运动医学和心脏病学的一个重要标志。确保̇VOpeak接近̇VO2max的最常用策略是应用次要的耗竭标准,如最大血乳酸浓度、最大心率、最大呼吸交换率或评级或最大感知耗竭评级。它们可以用来降低对̇VO2max的潜在低估程度,正如最近Knaier等人和Wagner等人所描述的那样。然而,这些标准的值在不同的参与者之间有很大的不同,并且受到所使用的运动方案的影响。因此,即使使用相当高的、经过年龄调整的二次耗竭标准,也不能排除对̇VO2max的低估。另一种策略是在普通的增量测试后进行亚最大限度的核查(例如最大工作率的95%)。正如最近所证明的那样,这种方法可能有助于识别增量测试的亚最大̇VOpeak值,特别是在久坐和临床人群中,但也包括娱乐活动参与者。然而,如第2.3.3节所述,亚最大限度的验证训练不允许诊断出̇VO2pl和相应的̇VO2max。
基于这一点和前面的章节,我们建议采用以下方法。对于̇VO2max∕̇VO2peak仅作为描述性变量(如年龄或性别)的大多数研究来说,通过使用适当的、经过年龄调整的二次衰竭标准来验证̇VO2peak似乎已经足够。对于所有以̇VO2max∕̇VO2peak为主要结果的研究,应将̇VO2轮廓设定为亚最大强度领域增加量的50%,并使用相当大的采样间隔来检查是否出现了̇VO2pl(见第2.1节)。如果没有出现̇VO2pl,则应进行(亚最大)验证测试,允许有足够的验证时间(见第2.3.3节)以确保̇VO2peak尽可能接近̇VO2max。相反,对于高度耐力训练的参与者来说,这种方法似乎是不够的,因为他们无法在短期恒定负荷测试中达到̇VO2max。
5 结论
有相当一部分研究使用了不恰当的̇VO2pl定义和方法,因此其研究结果的有效性是有限的。因此,不清楚̇VO2pl的发生率是否取决于运动方式或增量率(见第2.2和2.3.1节)。此外,没有令人信服的证据表明,与连续增量测试相比,经典的不连续测试中的̇VO2pl发生率更高(见第2.3.2节)。由于大多数评估超大规模验证阶段的研究都报告了验证时间的不足,因此,在确定̇VO2pl和̇VO2max方面,超大规模验证测试方法比单一增量测试程序更有优势的证据也相当有限(见第2.3.3节)。初步证据表明,̇VO2pl的发生是由生理因素决定的,如无氧能力、̇VO2动力学和亚最大强度领域的代谢物的积累。
以后的研究应更加注意使用有效的̇VO2pl定义,以避免其研究结果因虚假̇VO2pl诊断的高风险而产生偏差。因此,截断点应设定为亚最大强度领域中̇VO2相应增加的50%,并应使用相当大的采样间隔,以使假阳性和假阴性̇VO2pl诊断的风险相等,并考虑到通气引起的̇VO2的变化(见2.1节)。如果使用验证阵痛来验证̇VO2max∕̇VO2peak的实现,应确保它们能够持续足够长的时间,使̇VO2上升到最大值。