|
成分数据分析方法在身体活动与健康研究领域的应用展望
张 婷1,2,李红娟1,2*
(1.北京体育大学 运动人体科学学院,北京 100084 2.北京体育大学 运动与体质健康教育部重点实验室,北京 100084)
摘 要:身体活动与健康领域部分数据属于成分数据,在研究成分数据对健康的影响时,若忽视成分数据“定和限制”的本质,则会对研究结果产生较大影响。成分数据分析则克服了这一问题,并已应用于多个研究领域。研究梳理了成分数据分析的发展路程与方法学,并结合身体活动行为数据的特性探讨了传统相关研究的局限性,综述了使用成分数据分析的活动行为的相关研究。结果显示:1)组合行为产生的健康效应大于单一行为;2)传统的孤立研究的结果存在矛盾性,表明综合分析活动行为与健康结局关联性的必要性;3)成分数据分析的身体活动行为的相关研究基本支持了中高强度身体活动(moderate to vigorous-intensity physical activity,MVPA)的健康效益,但指出MVPA水平的保持则更有意义,此外,还强调了在追求MVPA增加的情况下,剩余时间的合理分配对健康促进的重要意义;4)未来身体活动与健康领域的研究可着重于行为组合模式与健康结局之间的效应及实证性的追踪调查。
关键词:成分数据分析;身体活动;健康;定和限制;联合影响
身体活动相关行为与体质和个体生命质量密切关联,是身体活动与健康领域的研究热点。与身体活动不足密切相关的慢性非传染性疾病的流行,成为世界范围内的重要健康威胁。身体活动不足是慢性非传染性疾病和过早死亡的主要风险因素(Lee et al.,2012),而身体活动(physical activity,PA)水平的提高被认为是健康促进的重要因素(Foster et al.,2018)。长期以来,身体活动的干预研究多着眼于孤立地分析提高中高强度身体活动(moderate to vigorous-intensity physical activity,MVPA)或降低久坐行为(sedentary behavior,SB)的效应,忽视了24 h活动行为在时间使用上的“定和限制”以及整体看待不同活动行为之间组合模式的重要性。在身体活动与健康领域的研究中,亦存在其他数据具有此“定和限制”的特性,如各身体成分构成比等。此类数据含有多个分量(component),每个分量非负数且相加总和为常数,这种具有“定和限制”特性的数据称为成分数据。
成分数据各分量完整而详尽地组成一个有限的整体,各分量之间具有共线性(Matricciani et al.,2018),其中一个分量量的减少,必然伴随其他一个或多个分量量的增加。例如,人类一天内所有活动行为时间的总和为24 h,当MVPA时间减少时,相应减少的时间必定会重新分配至其他日常活动(低强度身体活动、睡眠和SB)。传统的多元线性回归分析未考虑成分数据各分量之间的相互影响,孤立地研究了它们与健康结局的关系,所得的结果和结论的解释并不具严格的科学性,需要转变现有的身体活动研究范式,以“活动-平衡”的研究框架,综合地看待一天中的所有活动行为(Pedišić,2014)。至此,成分数据分析的统计方法开始逐渐应用于身体活动研究领域。成分数据分析的本质是通过数据转换解决“定和限制”问题和在消除各分量之间相互影响的前提下,采用多元线性回归等传统统计方法探究身体活动等成分数据变量与健康结局之间的关系。本文将追溯成分数据分析方法的发展,梳理其方法学过程,探讨身体活动行为相关研究的思想与方法理应从“孤立”向“综合”转变的必要性,并综述身体活动行为对健康结局的综合影响,以期为该领域成分数据分析的进一步应用提供一定参考。
1 成分数据分析方法的提出与发展
在身体活动与健康研究中存在诸多成分数据性质的变量,如身体活动相关行为、身体成分等,因而,成分数据分析方法的提出与发展对该领域产生科学的研究结果具有重大意义。成分数据分析方法主要经过以下4个阶段,并广泛应用于身体活动流行病学研究领域。
1.1 传统统计方法引起质疑阶段
1960年以前,研究者普遍忽视成分数据“定和限制”的特点,以(为开放性数据设计的)传统统计方法分析此类数据。Pearson(1897)明确指出,相关分析结果显示的比例数据之间的相关性是伪相关,其未考虑到分子分母中含有公共部分产生的效应。但在当时并未引起重视。直到1960年,地质学家Chayes对地球化学成分之间的积差相关系数的解释性提出质疑,成分数据的统计方法问题才得到正视。这一阶段仅属于认知层面的改善,研究集中于证明使用标准统计方法分析成分数据产生的结果失真,并未提出解决方法。
1.2 成分数据分析方法起步阶段
20世纪80年代,以Aitchison为主的许多学者亦开始讨论和阐明成分数据的特有属性,指出成分数据显示的是相对的信息而非全部,各分量可以以比例表示,认为对单个分量的统计分析是没有意义的(Aitchison,1986),为成分数据新的统计分析方法奠定了基础。1986年,Aitchison发表了首部系统介绍成分数据的论著《成分数据统计分析》,该著作的核心是提出通过成分向量比值的对数,即“对数比”对成分数据进行数据转换(非对称性变换及对称性变换),以适用为开放性数据设计的标准统计分析方法。同时还介绍了成分数据的样本空间单形、对数比协方差结构、加法逻辑正态分布等一系列针对成分数据的理论体系。这一阶段提供了针对成分数据分析的可行统计方法,是成分数据发展的重要节点。
1.3 成分数据分析方法的发展阶段
21世纪初,随着研究的深入,成分数据的特有度量向量空间(a metric vector space)(Billheimer et al.,2001;Pawlowsky-Glahn et al,2001)的定义与方法学得以发展。类似于实数空间上的加法和数乘运算,成分数据在单形空间上分别定义了扰动和幂等简单度量标准,以便用于表示成分数据的空间位置和解释成分数据间的关系。由此,许多成分数据问题可以在这个空间内以其特定的Aitchison几何结构来研究。2003年,针对现有“对数比”变换的局限性,Egozcue(2003)等人提出了等距对数比变换,保证了成分数据在单形空间中的相对距离在经过映射至欧式空间后仍保持不变。这些针对成分数据的数学特性的定义及方法的研究解决了成分数据分析的众多挑战,推动了成分数据分析方法在多领域的应用。
1.4 成分数据分析方法多领域应用阶段
至今,成分数据分析方法发展迅速,已不断应用于多个领域,包括生物学、基因组学、生态学、经济学、医学、营养学(Trinh et al.,2019)及流行病学领域。成分数据分析方法在身体活动流行病学领域的应用最早可追溯至Zhu等在2002年的研究,该研究以成分数据分析方法比较黑人和白人妇女的身体活动模式。2013年,Zhang在其题为“成分数据建模及其生物医学应用”的博士论文中,以身体活动行为为例,展示了成分数据分析的可行方法与应用领域。但直到2014年,澳大利亚学者Pedišić使用传统多元统计方法分析身体活动与健康结局关系的不足,该方法才在该领域被正式接受与应用。与此同时,成分数据分析方法已逐步发展成为多领域学者所认可的统计学分支。
2 成分数据分析的方法学
2.1 成分数据的性质
据统计学的定义,成分数据是指任意为正的矢量X,满足x1+x2,…,xD=c,c为任意常数。成分数据的样本空间称为单形,单形的统计学定义(Pawlowsky-Glahn et al.,2015)为:
pagenumber_ebook=70,pagenumber_book=68
与实数集R[开放性数据取值范围(-∞,+∞)]的空间(欧式空间)完全不同。成分数据具有“定和限制”的基本特征,其分布亦相对复杂。“定和限制”不仅使成分数据间各分量具有共线性,即当组合内一个分量因某种因素发生一定量的变化时,则相应地,剩余分量中的一个或多个也会同时发生量的反向变化,并且导致成分数据各个分量不服从正态分布。因此,对成分数据的分析和预测成为难题,限制了涉及成分数据的相关问题的研究。直到Aitchison(1986)提出了对数比变换、协方差矩阵及加法逻辑正态分布等理论及方法,才解决了成分数据分析的分布及定和限制等问题。
2.2 成分数据分析的方法
成分数据受“定和限制”影响,因而其分析方法不同于传统的标准多元统计方法。成分数据的描述性统计包括集中趋势和离散趋势,分别采用几何平均和变异矩阵的方法来分析。至于统计推断,成分数据需要首先经过数据变换变为非限制性数据,进而适用于传统的统计方法,如多元线性回归及等量替代等。但成分数据进行统计推断的困难不仅来自对成分的定和限制,而且还受成分数据高维数及可能存在零值数据的影响。
2.2.1 成分数据的描述统计方法
成分数据采用成分几何平均来显示其数据的集中趋势,并已被证明能更好地显示数据集的中心。传统常用的标准差适于衡量单变量的离散趋势,而成分数据为多变量且具有共线性。成分数据单个分量的方差(如SB的方差)实际上不包含任何信息,因为单个分量的变化(如SB时间使用的变化)必然与另一分量的变化相关。同时,由于成分数据的定和限制会产生伪相关,因而分量之间的相互依赖性不能通过传统的相关性分析或协方差来呈现(Chaves,1975)。鉴于此,Aitchison(1986)提出变异矩阵,其通过所有成对分量比值对数的方差[如ln(SB/MVPA)的方差],展示了两两分量之间的相互依赖性。计算所得值越小代表两分量间依赖性越大。
2.2.2 成分数据的变换
2.2.2.1 加法对数比变换
加法对数比变换(the additive log-ratio,alr)属于一种非对称变换,也称为alr变换,定义为:
pagenumber_ebook=71,pagenumber_book=69
非对称性变换具有以下优势:1)具有降维作用,令成分数据由原先的D维空间降至(D-1)维空间,由原先D个线性相关的变量,变换至D-1个独立的对数比坐标,解决了成分数据分量的共线性问题;2)转换后的对数比坐标为非限制性数据取值在(-∞,+∞),适于线性模型的应用;3)在保证成分向量服从D维加法逻辑正态分布的情况下,变换后的向量也会服从(D-1)维正态分布。
但是,对数比变换的关键在于分母的选择。加法对数比坐标的分母使用的是χD(最后一个分量,但是排序不同最后一个分量就不同),这将导致一个问题:对于不同的分母,变换后的空间中点之间的距离并不相同。并且这种分母不定的变换,限制了以成分数据作为因变量的线性统计方法的科学性。因为当除数有了变化时,线性统计方法并不能做出相应的适应(Aitchison et al.,2000)。在模型的解释方面,由于变换后的对数比坐标并不能完全和原始变量相对应,因此,在实际的分析中还难以得到采用。
2.2.2.2 中心化对数比变换
中心化对数比变换(centred log-ratio,clr)是在解决非对称对数比变换的基础上发展出来的一种对称对数比变换,也称为clr变换,定义为:
pagenumber_ebook=71,pagenumber_book=69
中心化对数比变换采用所有分量的几何平均值作为分母。但其缺点在于变换后的变量产生的协方差矩阵是奇异的(数据矩阵内的总相关性为-1),在标准统计过程未做出适应性变化前,难以进行相应的分析(Pawlowsky-Glahn et al.,2015)。
2.2.2.3 等距对数比变换
等距对数比变换(isometric log-ratio,ilr)(Egozcue et al.,2003)是一种基于标准正交基并构建于clr坐标D-1维超平面上的变换,定义为:
pagenumber_ebook=71,pagenumber_book=69
等距对数比既不存在alr分母的任意性问题,亦不具clr的协方差矩阵奇异性问题(Buccianti,2011),为目前最常用的对数比变换。等距对数比变换保持了变换前各分量在单形空间的相对距离。该变换克服了成分数据的多元共线性(Dumuid et al.,2018c;Egozcue et al.,2003)。
等距对数比变换的方式有多种(Van Den Boogaart et al.,2013),但其类型的不同并不会导致随后分析结果的不一致。顺序二进制划分方法(sequential binary partition,SBP)(Egozcue et al.,2005)常被用来确定ilr的变换形式。基于此,研究者可根据有关成分数据的专业知识并针对特定的研究问题,选择特定的ilr的变换方式。但在应用逆等距对数比变换将变量返回至单形空间时,必须确保使用的划分方法相同。
2.2.3 多元线性回归预测模型及成分等量替代方法
在成分数据的分析中,多元回归分析常与成分等量替代同时运用。这是因为成分等量替代具有将自变量的变化对结局指标产生的效果定量化的作用,且自变量的量的变化及量的再分配对象可以根据研究者需要来设置[如MVPA的10 min或30 min,重新分配给SB或低强度身体活动(light-intensity physical activity,LPA)]。
2.2.3.1 多元回归模型
成分数据的多元回归模型根据成分数据为自变量还是因变量,可分为3类:1)自变量为成分数据,因变量为实数数据;2)自变量为实数数据,因变量为成分数据;3)自变量和因变量均为成分数据。成分回归模型主要有3个步骤:1)数据的转换(对数比转换);2)以标准多元统计分析过程进行模型拟合;3)对结果的解释及预测推断。研究者可根据数据集的性质进行模型的选择,以达到合理分析数据的目的。
成分多元回归模型的系数解释与传统回归模型略有不同。D分量成分数据转换后,将得到(D-1)个坐标,但只有第一个坐标系数用来解释结果效益。因为只有第一个坐标包含信息全面,表示相对于其余分量,第一分量在时间使用分布中的相对重要程度,模型参数β1解释了分量x1的相对信息对y的影响。为了得到其余分量对y的影响,可以对向量X的分量进行顺序置换,使每个分量都能作为第一个分量。成分多元回归模型消除了分量间共线性的影响,可用于分析各分量结构性变化对结局指标的效益,如身体活动时间使用的结构性变化对健康结局的影响。
2.2.3.2 成分等量替代
成分等时替代分析源自传统等时替代分析,是为了便于将研究成果转化为临床实践,而将某一分量固定时间的变化对健康产生的效益进行定量化的方法。传统替代分析是剔除一个或多个分量,同时加入总量(所有分量的量的总和)加以修正,但其方法仍具有一定的限制性,主要包括:1)剔除的分量对健康的影响依旧是未知的;2)未被剔除的分量之间的共线性未消除,所得结果可能具有误导性。成分等时替代将经过转换的数据带入模型进行定量化分析,其优势有:1)克服了成分数据共线性问题,分析时包含了所有成分数据分量;2)比传统的替代更丰富,可以“一对一”替代,又可“一对多”替代。
成分替代模型的应用可指明组合内哪些部分对健康更重要并且量化这种量的变化对健康结局的效益(如BMI下降x%)。成分等时替代使特定健康结局的最佳替换模式能够被识别。例如,基于样本均值组合作为参考值,将久坐行为的时间再分配至MVPA,这一再分配模式对多数结局指标最有利,并可针对人群中不同时间使用组合进行相应分析,获得不同的最佳替换模式。因而,在流行病学研究中常把成分等时替代分析与成分数据分析结合使用,使研究结果更具针对性和实用性。
2.2.4 零值的处理
成分数据需经过对数比变换才能进行分析,而对数比要求观测值必须严格非零。实际上,数据集中是可能会存在零值。零值主要分为两类:1)近似零值,源于低于检测极限而未被仪器测量获得,与仪器的精度有关;2)真实零值,源于相应的观测值完全不存在,即真正的零值。针对近似零值的处理方法主要包括乘法简单替换法(Martín-Fernández,2003)、基于 alr坐标的 EM(expectation maximisation)算法(Palarea-Albaladejo et al.,2007,2008)、基于 ilr坐标的EM 算法(Martín-Fernández et al.,2012)、乘法对数正态替换方法(Palarea-Albaladejo et al,2013)、基于alr坐标的数据扩充算法(Palarea-Albaladejo et al.,2014)、Kaplan-Meier平滑样条替换方法(Palarea-Albaladejo et al.,2015)(常用于生存分析)及基于ilr坐标的偏最小二乘回归插补法(Templ et al.,2016)。针对真实零值的处理,主要为Aitchison等(2003)提出的基于模型建立的参数方法及在此基础上提出的混合模型(Stewart et al.,2010)和对数正态混合模型的处理方法(Bear and et al,2016)。
3 综合分析身体活动与健康相关研究的必要性
3.1 身体活动行为的性质特点
身体活动行为属于成分数据范畴,本质为多变量,这些变量的分类并不是一成不变的。例如,关于蓝领工作者的研究,常将24 h活动行为分为工作时间活动行为(步行、站立、久坐及高强度活动)和休闲娱乐时间的活动行为(久坐行为、步行、站立、高强度活动和睡眠)(Lund Rasmussen et al.,2019)。亦有研究通过“MARCA活动层次”对24 h活动进行更详细的分类(Olds et al.,2019)。但是,对大多数人群来说,最常用分类标准仍是以能量消耗为基础的,主要包含:1)状态(清醒/不清醒);2)姿势(躺/坐/站立);3)相对能量消耗。从而将24 h活动行为分为睡眠、SB、LPA和MVPA。成分数据的分类多种,但所生成的不同组合都具有相同的数学性质(Barcelo-Vidal et al.,2016)
个体典型一天的身体活动相关行为包括SB、睡眠、LPA和MVPA,时间总和固定为24 h,占比总和为100%。因此,SB、睡眠、LPA和MVPA本质上是共线的和相互影响的,一种行为时间的增加必然相应减少至少另一种行为的使用时间。在身体活动与健康领域存在许多此类数据(成分数据),传统的多数研究已观察到身体活动行为间的相互影响并发现组合行为产生的效应大于单一行为,因而综合分析身体活动行为是必要的。
3.2 身体活动行为的交互作用与联合影响
24 h活动行为是一个活动连续体,但是诸多的干预措施仅聚焦于MVPA的促进(Kohl et al.,2012)和SB的减少(Healy et al.,2017),忽视了身体活动行为之间的交互作用对健康结局的影响。Chaput等(2014)曾指出,若儿童睡眠不足或屏幕时间过长,MVPA的一些健康效益可能会丧失。亦有研究指出,睡眠不足可能会影响身体活动水平,进而影响健康结局。随着研究的深入,越来越多的人认为活动行为是相互影响的(Espinel et al.,2015;Williams et al.,2014),最佳健康状态可能与行为组合模式有关,而不是与单个行为有关(Saunders et al.,2016)。身体活动行为是共同作用后产生了对健康结局的影响,因而,从行为组合模式角度整体看待是很有必要的。
不健康行为组合对健康结局的不利效果与健康行为组合对健康结局的保护作用可能均大于单一行为。24 h活动行为均与健康结局关联(Rezende et al.,2016;St-Onge et al.,2016)。当个体不健康行为过多时,对健康产生的不利影响可能就越大。Pedišić等(2017)曾指出,相比于肥胖等风险因素,死亡更多是由不健康的时间分布造成的,即潜在的不健康活动行为组合是一类健康风险因素,但其是可调整的。在一项大样本实证研究中(Carson et al.,2015),“活跃的屏幕”(身体活动量较高和屏幕时间较长,1.19倍)和“最不健康的运动者”(身体活动量较低、睡眠时间较短、屏幕时间较长,1.24倍)与“最健康的运动者”(屏幕时间较短、睡眠时间较长、身体活动量较高)相比,超重和肥胖的概率更高,在女性亚组样本中呈现相同趋势,而男性则不明显。这种性别差异,可能是由于男女日常活动结构不同或研究方法不同。一项行为组合研究指出,高PA/长睡眠/低SB的儿童和青少年与低PA/短睡眠/高SB的儿童和青少年相比,肥胖和心脏代谢健康状况较好(Saunders et al.,2016)。且与短睡眠/高SB相比,长睡眠/低SB更益于心脏代谢健康指标,但对肥胖无效益。由此,应考虑针对个体,特别是女性(Carson et al.,2015)进行组合行为干预。
3.3 孤立分析身体活动行为效应的矛盾性
身体活动行为属于成分数据,传统孤立分析的研究结果存在异质性,统计方法的使用亦可能是促因。有研究指出,高强度身体活动(vigorous intensity physical activity,VPA)更有益于健康结局(Gebel et al.,2015;Lahti et al.,2014;Owens et al.,2017);而另有研究认为,中等强度身体活动(moderate intensity physical activity,MPA)对健康结局更有利(Sabia et al.,2012)。这些研究的健康结局、人群、协变量略有差异,可能是部分致因。但不可忽视的是统计方法是否准确,也许亦是研究结果矛盾性的原因之一。VPA的保护效益或许伴随久坐减少或睡眠充足,而MPA的较弱效益也许伴随了久坐的增多或睡眠的不足。Kikuchi等(2018)曾指出,在均达到推荐量的情况下,VPA与MPA可能具有相匹敌的效果。Kikuchi据指南(Haskell et al.,2007)将身体活动活跃者分为3类(在MVPA中占比:0%VPA、≤30%VPA>30%VPA),发现与不活跃者相比,3类人群全因死亡危险比男性分别为0.75、0.73和0.74,女性分别为0.71、0.75和0.74。从数据中可以发现,男性后两个人群危险比均小于第一类,差异虽小(可能与剂量-反应相关)但行为间的联合影响不容忽视。Moore等(2017)就指出,在分别控制了SB和MPA后,VPA与相应的代谢指标关联性发生变化。
综合分析身体活动行为时间使用的整体分布情况是趋势。多数研究及活动指南仅考虑提高相应量的MVPA所带来的效益,即相当于只要你完成了60 min的MVPA,那么在剩余的时间里,无论你是久坐不动,还是前一天晚上睡眠不足都不重要。但事实上,由于一个活动行为时间的增加只能通过减少至少另一个活动行为的时间来获得,因而,孤立探究某一活动行为不能确定健康的效益在多大程度上是由于这项活动行为而不是由于时间重新分配至其他的活动(Rosenberger et al.,2019)。很多研究证明,提高相应量的身体活动或睡眠会产生不同的健康效益,具体取决于它是取代何种活动行为(Matricciani et al.,2018;Winkler et al.,2018),即不仅要考虑健康的主要影响分量,还要考虑到一天内剩余行为的时间分配情况。
4 基于成分分析,身体活动相关行为对健康结局的综合影响
孤立分析身体活动相关行为存在局限性,这一事实逐渐被广泛认可,并推动研究向新的一种流行病学范式转变[VIRTUE(Viable Integrative Research in Time-Use Epidemiology)研究框架](Pedišić et al.,2017)。基于这一范式,成分数据分析方法被普遍用来探究身体活动相关行为与健康结局之间的综合联系。常见的健康结局包含肥胖、心脏代谢指标、死亡率及一般健康或心肺健康等。
4.1 肥胖
1)活动行为整体与肥胖指标相关(Carson et al.,2017,2019;Dumuid et al.,2018a;Fairclough et al.,2018;Talarico et al.,2018),较高强度活动效益更好。具体表现为,相对于其他活动行为,SB或LPA与BMI z分和腰围呈正相关,而MVPA或睡眠则呈负相关(Carson et al.,2016)。但一项幼儿研究发现(Carson et al.,2017),活动行为整体与BMI z分相关,而与腰围无关。睡眠、SB、LPA或MVPA与BMI和腰围均不相关。Carson指出,该研究群体的特殊性(幼儿时间多用于睡眠)及该研究群体腰围的国际标准缺乏可能是产生此结果的原因。Carson等(2019)的另一项儿童青少年研究发现,SB和VPA分别与腰围正、负相关,但仅VPA与BMI z分负相关,而MPA与两项指标均无关。较高强度的身体活动对儿童青少年的肥胖干预可能更有利。
2)成分等时替代中,健康效益的大小取决于取代或被取代的活动行为且非对称性(Carson et al.,2016;Dumuid et al.,2018d;McGregor et al.,2019b;Talarico et al.,2018)。在成分等时替代过程中,Carson等(2016)发现,取MVPA 10 min分别再分配至SB、LPA和睡眠后,BMI z分相应增加5.1%,1.2%和1.1%,但是当反向替代时BMI z分均只降低不到1%。与其结果相一致,Dumuid等(2018d)曾指出,成分等时替代时,效益不一定对称,且在MVPA中体现最明显。MVPA被不同行为取代,产生的健康影响SB最大,可以看出保持MVPA和减少SB的重要性。Talarico等(2018)亦指出,欲降低BMI z分一个单位,MVPA增加与LPA减少是较有效的方法。
3)强调MVPA水平保持的重要性。一项研究发现,儿童假期与上学日的时间使用差异显著(Olds et al.,2019),假期不健康行为增多,能量消耗减少,是运动强度下降的高发时期,是肥胖干预的重要时期。Dumuid等(2019)亦指出,MVPA减少15 min,躯干脂肪及非躯干脂肪百分比分别增加1.7%和0.8%,远大于增加15 min MVPA所带来的有利效果,体现了防止MVPA水平下降的重要性。另一项随机干预实验指出,长期地干预身体活动及增加MVPA,健康效益程度和范围越大(Winkler et al.,2018)。因而,欲达到效益的可持续性和最佳化,时间的持续性及运动类型或强度的选择是重点
4.2 一般健康或心肺健康
不同组合模式对健康结局的效益不同,健康行为组合效益最大。一项基于聚类分析,将生活方式相似的儿童归类的研究发现,多面健康者(低屏幕时/健康饮食/适量PA和SB)的生活质量得分最高(Dumuid et al.,2017)。健康的生活方式组合,如低屏幕时间、健康的饮食习惯和均衡的日常活动行为对儿童的健康效益最大,健康促进的干预理应从这几个方面着手。另一项基于人类发展指数(human development index,HDI)的研究(Dumuid et al.,2018b)发现,儿童的健康相关生活质量与其活动行为的关联受国家HDI的影响。但不同国家不同组合模式与健康的关联性基本相似,因而,在为世界各地的儿童制定24 h活动行为指南时,既要考虑组合模式的整体效益,还应考虑不同区域内发展情况对行为干预的附加要求。
不同人群的日常活动行为模式对健康的影响及可能的干预方式。Hunt等(2018)指出,屏幕时间和静坐时间更长的慢性肺阻塞(chronic obstructive pulmonary disease,COPD)病人风险综合指数(BODE)高,提高身体活动水平的同时,着重减少静坐行为应是此类患者的干预重点。在蓝领工人研究中,Gupta等(2018,2019)通过“一对多”的成分等时替代发现,增加睡眠和MVPA对舒张压(systolic blood pressure,SBP)有利,增加SB与LPA对SBP不利,但仅睡眠和SB有统计学意义。MVPA效益不明显可能是由“一对多”的替代方式造成的。MVPA增加的时间源于剩余行为集体减少的时间,包括SB、睡眠和LPA,这里SB减少的时间可能并不足以达到健康水平的一个明显变化。后续“一对一”替代方式的研究可以深入了解MVPA的效益。同时,工人常有负重等对心血管负担较大的活动,对血压会产生一定的影响,亦会直接影响休闲领域的活动行为(Lund Rasmussen et al.,2019)。在对蓝领等工作者进行健康干预时需考虑这些因素。
4.3 心脏代谢指标
动态性活动行为益于心脏代谢健康,但睡眠的影响亦不可忽视。一项针对2型糖尿病(type 2 diabetes mellitus,T2DM)高危人群的研究(Biddle et al.,2018)发现,动态性活动行为与代谢指标的关联在进一步修正BMI后消失。但在成分替代时,该行为增加产生的有利效益仍存在。动态性活动行为可能是患有T2DM成年人提高代谢健康的重要干预手段。另一项包含成人和老年人两个队列的研究(McGregor et al.,2018)指出,MVPA在成人中对心脏代谢指标有利,在老人中这种效益会变弱或消失,不同队列中产生的效果差异可能源于衰老和MVPA的质量(如持续时间等)等因素。法国学者Debache等(2019)就曾指出,间断的MVPA与部分健康指标未发现显著关联。两篇分别针对加拿大与美国同年龄段儿童(6~17岁)的研究,前者发现MVPA与心脏代谢指标有利相关(Carson et al.,2016),而后者几乎没有观察到相关性(Carson et al.,2019)。鉴于研究结果的不一致性,Carson指出可能是由于美国研究未纳入睡眠。而睡眠与SB及睡眠与PA存在许多相互作用(Chaput et al.,2017),且睡眠亦与心脏代谢指标具有关联(St-Onge et al.,2016)。有关活动行为与健康的系列研究,协变量的纳入亦具有重要意义,同时还需关注活动行为的质量。
4.4 死亡风险与骨健康
在死亡风险研究中,MVPA为主要的影响变量,但在某些特定情况下,这种影响可能会减弱。一项前瞻性研究发现,纳入健康状态和身体活动限制后,MVPA与死亡风险的相关减弱(McGregor et al.,2019a)。对该相关,McGregor(2019a)认为部分是因MVPA作为个体是否有活动限制的暗示性指标产生了与死亡风险的关联。当然还需要更多的证据来支撑这种现象的产生。
在骨健康研究中,主要影响变量具有性别差异,不同健康状态的人群干预重点亦不同。一项前瞻性队列研究发现,相对于其他活动行为,增加MVPA可减缓老年男性的骨质流失,而增加LPA并维持MVPA可能是提高老年女性骨量的最佳方法(Rodriguez-Gomez et al.,2019a)。另一项骨健康研究发现,降低SB可能是提高健康男性骨量的较好策略,而在虚弱前期的女性中,MVPA可能是提高骨骼健康的重要因素(Rodriguez-Gomez et al.,2019b)。性别之间的这种效果差异与男女之间日常的身体活动类型及强度差异相关,提示,针对不同性别或人群进行干预的必要性。
5 成分数据分析方法的应用前景
在身体活动与健康领域,现有研究表明了身体活动行为之间的相互作用和对健康的联合影响(成分数据特性),以及健康(LPA、MVPA)与不健康行为(久坐行为)组合产生的效应均大于单一行为,因而,整体看待所有行为的组合模式是未来研究的发展方向。而目前基于成分数据分析,着眼于组合模式的研究甚少,未来有望在相应方面进行深入研究。
5.1 健康相关行为的最佳组合研究
一直以来,研究多强调高MVPA或短SB为主要影响变量,但是一天内剩余时间的活动行为构成也是十分重要的。部分研究指出,不健康行为(如久坐行为)对健康的负面影响会抵消健康行为(如LPA、MVPA)产生的效益。干预理应从行为组合模式入手。但行为组合的最佳模式并非需产生最大的健康效益,而需着眼于可行性与可持续性。从生理学、心理学和社会学的角度出发,制定有针对性并为大多数人所习惯的活动行为模式,才更具可持续性,才能成为最佳的行为组合模式。
5.2 健康与不健康行为组合的平衡点研究
多面健康者(如短SB/适度睡眠/高身体活动水平)被认为是最优的活动行为组合,但是对于达到产生健康效益,组合内身体活动量的最低阈值及久坐行为的最高阈值或是健康活动行为与不健康活动行为的平衡点并未确定,其可能是未来研究的方向。同时,不能忽视睡眠时间的最低阈值,但目前在研究最佳组合模式时,考虑睡眠的研究还是相对较少的。
5.3 特殊人群行为组合模式研究
目前针对临床人群等特殊人群(如糖尿病人)的研究,多指出主要的影响变量(如MVPA)及确定这些人群中最常见的不健康行为,但具体的、针对不同人群健康的活动行为组合模式的确定还需要进一步研究。同时,这些组合模式的短期及长期的效益需要进行纵向的研究实证。
5.4 纵向研究
现有纵向研究仅为极少数,大部分结果结论基于横断面研究,具有局限性。需要大量的纵向实证研究对所得结果进行验证。
6 结语
身体活动相关行为本质为成分数据,而成分数据具有“定和限制”,各分量之间相互依赖。单一行为对健康结局的影响可能伴随了其他活动行为的影响,因而需整体分析活动行为产生的联合影响。但传统的统计方法并不适于成分数据也不能进行整体分析,所以需采用成分数据分析方法对此类数据进行分析。据身体活动相关行为特性,在日常的活动干预中,需同时考虑主要影响分量(MVPA)与剩余活动行为的时间使用,从行为组合模式角度出发。
成分数据分析和成分等时替代统计方法,解决了成分数据分量间的相互影响对健康结局的效应问题,科学客观地识别了不同活动行为组合模式对健康指标的影响并可给出最佳的活动行为模式,为活动指南等指导性规范或政策提供依据,以提高各群体或个人的健康水平。
参考文献:
AITCHISON J,1986.The Statistical Analysis of Compositional Data[M]//Monographs on Statistics and Applied Probability.London:Chapman and Hall.
AITCHISON J,BARCELÓ -VIDAL C,MARTÍN-FERNÁNDEZ J A,et al.,2000.Logratio Analysis and Compositional Distance[J].Math Geosci,32(3):271-275.
AITCHISON J,KAY J W,2003.Possible solution of some essential zero problems in compositional data analysis[C]//Procrrdings of the Co CaCork 2003 Conference.Girona:University of Girona.
BARCELO-VIDAL C,MARTíN-FERNÁNDEZ J A,2016.The mathematics of compositional analysis[J].Aust J Stat,45(4):57-71.
BEAR J,BILLHEIMER D,2016.A logistic normal mixture model for compositional data allowing essential zeros[J].Aust J Stat,45(4):3-23.
BIDDLE G J H,EDWARDSON C L,HENSON J,et al.,2018.Associations of physical behaviours and behavioural reallocations with markers of metabolic health:A compositional data analysis[J].Int J Environ Res Public Health,doi:10.3390/ijerph15102280.
BILLHEIMER D,GUTTORP P,FAGAN W F,2001.Statistical interpretation of species composition[J].J Am Stat Assoc,96(456):1205-1214.
BUCCIANTI V P G A,2011.Compositional data analysis:Theory and applications[M].Chichester:John Wiley&Sons.
CARSON V,FAULKNER G,SABISTON C M,et al.,2015.Patterns of movement behaviors and their association with overweight and obesity in youth[J].Int J Public Health,60(5):551-559.
CARSON V,TREMBLAY M S,CHAPUT J P,et al.,2016.Associations between sleep duration,sedentary time,physical activity,and health indicators among Canadian children and youth using compositional analyses[J].Appl Physiol Nutr Metab,41(6 Suppl 3):S294-S302.
CARSON V,TREMBLAY M S,CHAPUT J P,et al.,2019.Compositional analyses of the associations between sedentary time,different intensities of physical activity,and cardiometabolic biomarkers among children and youth from the United States[J].PLoS One,14(7):e0220009.
CARSON V,TREMBLAY M S,CHASTIN S F M,2017.Cross-sectional associations between sleep duration,sedentary time,physical activity,and adiposity indicators among Canadian preschool-aged children using compositional analyses[J].BMC Public Health,17(Suppl 5):848.
CHAPUT J P,LEDUC G,BOYER C,et al.,2014.Objectively measured physical activity,sedentary time and sleep duration:Independent and combined associations with adiposity in canadian children[J].Nutr Diabetes,4(7):e117.
CHAPUT J P,SAUNDERS T J,CARSON V,2017.Interactions between sleep,movement and other non-movement behaviours in the pathogenesis of childhood obesity[J].Obes Rev,18:17-14.
CHASTIN S F,PALAREA-ALBALADEJO J,DONTJE M L,et al.,2015.Combined effects of time spent in physical activity,sedentary behaviors and sleep on obesity and cardio-metabolic health markers:A novel compositional data analysis approach[J].PLoS One,10(10):e0139984.
CHAVES F,1975.A priori and experimental approximation of simple ratio correlations[J].Concepts Geostatistics,106-137.
CHAYES F,1960.On correlation between variables of constant sum[J].J Geophys Res,65(12):4185-4193.
DEBACHE I,BERGOUIGNAN A,CHAIX B,et al.,2019.Associations of sensor-derived physical behavior with metabolic health:A compositional analysis in the record multisensor study[J].Int J Environ Res Public Health,doi:10.3390/ijerph16050741.
DUMUID D,LEWIS L K,OLDS T S,et al.,2018a.Relationships between older adults’use of time and cardio-respiratory fitness,obesity and cardio-metabolic risk:A compositional isotemporal substitution analysis[J].Maturitas,110:104-110.
DUMUID D,MAHER C,LEWIS L K,et al.,2018b.Human development index,children's health-related quality of life and movement behaviors:A compositional data analysis[J].Qual Life Res,27(6):1473-1482.
DUMUID D,OLDS T,LEWIS L K,et al.,2017.Health-related quality of life and lifestyle behavior clusters in school-aged children from 12 countries[J].J Pediatr,183:178-183,e2.
DUMUID D,STANFORD T E,MARTIN-FERNANDEZ J A,et al.,2018c.Compositional data analysis for physical activity,sedentary time and sleep research[J].Stat Methods Med Res,27(12):3726-3738.
DUMUID D,STANFORD T E,PEDISIC Z,et al.,2018d.Adiposity and the isotemporal substitution of physical activity,sedentary time and sleep among school-aged children:A compositional data analysis approach[J].BMC Public Health,18(1):311.
DUMUID D,WAKE M,CLIFFORD S,et al.,2019.The association of the body composition of children with 24-hour activity composition[J].J Pediatr,208:43-49,e9.
EGOZCUE J J,PAWLOWSKY-GLAHN V,2005.Groups of parts and their balances in compositional data analysis[J].Math Geol,37(7):795-828.
EGOZCUE J J,PAWLOWSKY-GLAHN V,MATEU-FIGUERAS G,et al.,2003.Isometric logratio transformations for compositional data analysis[J].Math Geol,35(3):279-300.
ESPINEL P T,CHAU J Y,VAN DER PLOEG H P,et al.,2015.Older adults’time in sedentary,light and moderate intensity activities and correlates:Application of Australian Time Use Survey[J].J Sci Med Sport,18(2):161-166.
FAIRCLOUGH S J,DUMUID D,MACKINTOSH K A,et al.,2018.Adiposity,fitness,health-related quality of life and the reallocation of time between children’s school day activity behaviours:A compositional data analysis[J].Prev Med Rep,11:254-261.
FOSTER C,SHILTON T,WESTERMAN L,et al.,2018.World Health Organisation to develop global action plan to promote physical activity:Time for action[J].Br J Sports Med,52(8):484-484.
GEBEL K,DING D,CHEY T,et al.,2015.Effect of moderate to vigorous physical activity on all-cause mortality in middle-aged and older Australians[J].JAMA Intern Med,175(6):970-977.
GUPTA N,DUMUID D,KORSHOJ M,et al.,2018.Is daily composition of movement behaviors related to blood pressure in working adults?[J].Med Sci Sports Exer,50(10):2150-2155.
GUPTA N,KORSHOJ M,DUMUID D,et al.,2019.Daily domainspecific time-use composition of physical behaviors and blood pressure[J].Int J Behav Nutr Phys Act,16(1):4.
HASKELL W L,LEE I M,PATE R R,et al.,2007.Physical activity and public health:Updated recommendation for adults from the American College of Sports Medicine and the American Heart Association[J].Med Sci Sports Exer,39(8):1423-1434.
HEALTH M O,2017.Sit Less,Move More,Sleep Well Active Play Guidelines for Under-Fives[M].Wellington,New Zealand:Ministry of Health.
HEALY G N,WINKLER E A H,EAKIN E G,et al.,2017.A cluster RCT to reduce workers’sitting time:Impact on cardiometabolic biomarkers[J].Med Sci Sports Exer,49(10):2032-2039.
HUNT T,WILLIAMS M T,OLDS T S,et al.,2018.Patterns of time use across the chronic obstructive pulmonary disease severity spectrum[J].Int J Environ Res Public Health,doi:10.3390/ijerph15030533.
KIKUCHI H,INOUE S,LEE I M,et al.,2018.Impact of moderateintensity and vigorous-intensity physical activity on mortality[J].Med Sci Sports Exer,50(4):715-721.
KOHL H W,CRAIG C L,LAMBERT E V,et al.,2012.The pandemic of physical inactivity:Global action for public health[J].Lancet,380(9838):294-305.
LAHTI J,HOLSTILA A,LAHELMA E,et al.,2014.Leisure-time physical activity and all-cause mortality[J].PLoS One,9(7):e101548.
LEE I M,SHIROMA E J,LOBELO F,et al.,2012.Effect of physical inactivity on major non-communicable diseases worldwide:An analysis of burden of disease and life expectancy[J].Lancet,380(9838):219-229.
LUND RASMUSSEN C,PALAREA-ALBALADEJO J,KORSHOJ M,et al.,2019.Is high aerobic workload at work associated with leisure time physical activity and sedentary behaviour among bluecollar workers?A compositional data analysis based on accelerometer data[J].PLoS One,14(6):e0217024.
MARTÍN-FERNÁNDEZ J A,2003.Dealing with zeros and missing values in compositional data sets using nonparametric imputation[J].Math Geol,35(3):253-278.
MARTÍN-FERNÁNDEZ J A,HRON K,TEMPL M,et al.,2012.Model-based replacement of rounded zeros in compositional data:Classical and robust approaches[J].Comput Stat Data An,56(9):2688-2704.
MATRICCIANI L,BIN Y S,LALLUKKA T,et al.,2018.Rethinking the sleep-health link[J].Sleep Health,4(4):339-348.
MCGREGOR D E,CARSON V,PALAREA-ALBALADEJO J,et al.,2018.Compositional analysis of the associations between 24-h movement behaviours and health indicators among adults and older adults from the Canadian health measure survey[J].Int J Environ Res Public Health,doi:10.3390/ijerph15081779.
MCGREGOR D E,PALAREA-ALBALADEJO J,DALL P M,et al.,2019a.Compositional analysis of the association between mortality and 24-hour movement behaviour from NHANES[J].Eur J Prev Cardiol,doi:10.1177/2047487319867783.
MCGREGOR D E,PALAREA-ALBALADEJO J,DALL P M,et al.,2019b.Differences in physical activity time-use composition associated with cardiometabolic risks[J].Prev Med Rep,13:23-29.
MOORE J B,BEETS M W,BRAZENDALE K,et al.,2017.Associations of vigorous-intensity physical activity with biomarkers in youth[J].Med Sci Sports Exer,49(7):1366-1374.
OLDS T,MAHER C,DUMUID D,2019.Life on holidays:Differences in activity composition between school and holiday periods in Australian children[J].BMC Public Health,19(Suppl 2):450.
OWENS S,GALLOWAY R,GUTIN B,2017.The case for vigorous physical activity in youth[J].Am J Lifestyle Med,11(2):96-115.
PALAREA-ALBALADEJO J,MARTÍN-FERNÁNDEZ J A,2008.A modified EM alr-algorithm for replacing rounded zeros in compositional data sets[J].Comput Geosci,34(8):902-917.
PALAREA-ALBALADEJO J,MARTIN-FERNANDEZ J A,2013.Values below detection limit in compositional chemical data[J].Anal Chim Acta,764:32-43.
PALAREA-ALBALADEJO J,MARTIN-FERNANDEZ J A,2015.zCompositions-R Package for multivariate imputation of left-censored data under a compositional approach[J].Chemometr Intell Lab,14385-96.
PALAREA-ALBALADEJO J, MARTÍN-FERNÁNDEZ JA,GÓMEZ-GARCÍA J,2007.A parametric approach for dealing with compositional rounded zeros[J].Math Geol,39(7):625-645.
PALAREA-ALBALADEJO J,MARTÍN-FERNÁNDEZ J A,OLEA R A,2014.A bootstrap estimation scheme for chemical compositional data with nondetects[J].J Chemometr,28(7):585-599.
PAWLOWSKY-GLAHN V,EGOZCUE J,TOLOSANA-DELGADO R,2015.Modeling and analysis of compositional data[M].Chichester,UK:John Wiley&Sons.
PAWLOWSKY-GLAHN V,EGOZCUE J J,2001.Geometric approach to statistical analysis on the simplex[J].Stoch Env Res Risk A,15(5):384-398.
PEARSON K,1897.Mathematical contributions to the theory of evolution:On a form of spurious correlation which may arise when indices are used in the measurement of organs[J].P Roy Soc Lond,60(359-367):489-498.
PEDIŠIĆ Ž ,2014.Measurement issues and poor adjustments for physical activity and sleep undermine sedentary behaviour research[J].Kinesiology,46(1):135-146.
PEDIŠIĆ Ž ,DUMUID D,OLDS T S,2017.Integrating sleep,sedentary behaviour,and physical activity research in the emerging field of time-use epidemiology:Definitions,concepts,statistical methods,theoretical framework,and future directions[J].Kinesiology,49(2):252-269.
REZENDE L F M,SA T H,MIELKE G I,et al.,2016.All-cause mortality attributable to sitting time:Analysis of 54 countries worldwide[J].Am J Prev Med,51(2):253-263.
RODRIGUEZ-GOMEZ I,MANAS A,LOSA-REYNA J,et al.,2019a.Compositional influence of movement behaviours on bone health during ageing[J].Med Sci Sports Exer,51(8):1736-1744.
RODRIGUEZ-GOMEZ I,MANAS A,LOSA-REYNA J,et al.,2019b.The impact of movement behaviors on bone health in elderly with adequate nutritional status:Compositional data analysis depending on the frailty status[J].Nutrients, doi: 10.3390/nu11030582.
ROSENBERGER M E,FULTON J E,BUMAN M P,et al.,2019.The 24-hour activity cycle:A new paradigm for physical activity[J].Med Sci Sports Exer,51(3):454-464.
SABIA S,DUGRAVOT A,KIVIMAKI M,et al.,2012.Effect of intensity and type of physical activity on mortality:Results from the Whitehall II cohort study[J].Am J Public Health,102(4):698-704.
SAUNDERS T J,GRAY C E,POITRAS V J,et al.,2016.Combinations of physical activity,sedentary behaviour and sleep:Relationships with health indicators in school-aged children and youth[J].Appl Physiol Nutr Metab,41(6 Suppl 3):S283-293.
ST-ONGE M P,GRANDNER M A,BROWN D,et al.,2016.Sleep duration and quality:Impact on lifestyle behaviors and cardiometabolic health:A scientific statement from the American Heart Association[J].Circulation,134(18):e367-e386.
STEWART C,FIELD C,2010.Managing the essential zeros in quantitative fatty acid signature analysis[J].J Agr Biol Envir St,16(1):45-69.
TALARICO R,JANSSEN I,2018.Compositional associations of time spent in sleep,sedentary behavior and physical activity with obesity measures in children[J].Int J Obes(Lond),42(8):1508-1514.
TEMPL M,HRON K,FILZMOSER P,et al.,2016.Imputation of rounded zeros for high-dimensional compositional data[J].Chemometr Intell Lab,155:183-190.
TREMBLAY M S,CHAPUT J P,ADAMO K B,et al.,2017.Canadian 24-hour movement guidelines for the early years(0-4 years):An integration of physical activity,sedentary behaviour,and sleep[J].BMC Public Health,17(Suppl 5):874.
TRINH H T,MORAIS J,THOMAS-AGNAN C,et al.,2019.Relations between socio-economic factors and nutritional diet in Vietnam from 2004 to 2014:New insights using compositional data analysis[J].Stat Methods Med Res,28(8):2305-2325.
VAN DEN BOOGAART K G ,TOLOSANA-DELGADO R,2013.Analyzing Compositional Data with R[M].Berlin Heidelberg:Springer-Verlag Berlin Heidelberg.
WILLIAMS S M,FARMER V L,TAYLOR B J,et al.,2014.Do more active children sleep more?A repeated cross-sectional analysis using accelerometry[J].PLoS One,9(4):e93117.
WINKLER E A H,CHASTIN S,EAKIN E G,et al.,2018.Cardiometabolic impact of changing sitting,standing,and stepping in the workplace[J].Med Sci Sports Exer,50(3):516-524.
ZHANG B,2013.On Compositional Data Modeling and Its Biomedical Applications[D].New York:Columbia University.
ZHU W M,AINSWORTH B,LIU Y L,2002.A comparison of urban black and white women’s physical activity patterns[J].Res Q Exerc Sport,73(1):A36.
Application Prospects of Compositional Data Analysis Method in Physical Activity and Health
ZHANG Ting1,2,LI Hongjuan1,2*
1.Beijing Sport University,School of Sport Science,Beijing 100084,China;2.Beijing Sport University,Exercise and Physical Fitness Key Laboratory of Ministry of Education,Beijing 100084,China
Abstract:Some compositional data were existed in the research field of physical activity and health,the research results will be greatly affected if the nature of"constant sum"of compositional data was ignored.Compositional data analysis method overcomes this problem and has been applied in many research fields.This study summarized the development path and methodology of compositional data analysis,and discussed the limitations of traditional studies by combining with the characteristics of movement behavior data.And lastly,this review summarized some related studies on activity behaviors which used compositional data analysis.It showed that:1)Health effects of combined behaviors were greater than single behavior;2)the results of traditional isolated studies were contradictory,indicating that comprehensive analysis of the association between activity behaviors and health outcomes is necessary;3)researches on physical activity related behaviors using compositional data analysis basically supports the health benefits ofoderate to vigorous-intensity physical activity(MVPA),but it was found that the maintenance of MVPA level was more meaningful.In addition,it also emphasized the importance of the reasonable allocation of the remaining time to health promotion when increasing MVPA;4)future research in the field of physical activity and health can focus on the association between behavior patterns and health outcomes by conducting follow-up investigations.
Keywords:compositional data analysis;physical activity;health;constant sum;combined impact
|
|