打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
多个分组因素的重复测量资料的方差分析

较为常见的重复测量(Repeated measure)是指对同一观察对象的同一个观测指标在不同时间点上进行多次测量,除了这种时间上的重复,还存在空间上的重复,比如同一研究对象不同部位的观测指标测量。重复测量对应的是个体内因素(Within-Subjects Factors,受试者内因素,组内因素),可以研究观测指标的变化趋势。更多的时候,研究者还想研究哪些因素会影响这种变化趋势,这就涉及到个体间因素(Between-Subjects Factors受试者间因素,组间因素)。当个体间的研究因素不止一个时,就是多个分组因素的重复测量数据。

重复测量数据的分析方法

重复测量的方差分析(单变量方差分析和多元方差分析)、Friedman非参数分析、混合线性模型/广义混合线性模型、广义估计方程。当重复测量的方差分析不满足适用条件时,可以采用Friedman非参数法。

重复测量设计分析的文章已经有过多篇笔记了,注意留言里面有笔记的一些校正。重复测量数据的方差分析【SPSS】重复测量数据的方差分析【JMP】线性混合模型/多水平模型【SPSS】再谈多层混合效应模型【STATA】广义估计方程【SPSS操作】广义估计方程【STATA操作】广义线性混合模型。方差分析只用于连续型资料,混合线性模型/广义混合线性模型和广义估计方程应用范围更广,可用于连续型资料、分类资料、计数资料等。特殊的重复测量设计也会考察配对t检验/Wilcoxon符号秩检验(前后测量设计)、交叉设计的方差分析等。
重复测量分析中因变量基线值的处理

在进行重复测量分析时,干预前的因变量值如何处理?是作为重复测量的一个数据点?还是作为基线进行处理?这里所说的基线处理,是指先将其进行组间比较,如果无统计学意义直接关注干预后的重复测量;如果有统计学意义,要么将其做为协变量对干预后的重复测量进行校正,要么用干预后的结果与基线的差值作为新的因变量进行比较。

目的不同,采用的处理方法也不同,不能说哪种方法一定是错误的。
干预前的因变量值作为基线处理,更容易理解,结果解读更为方便。想象一下,在一个因变量为连续资料的完全随机设计的两样本试验中,我们是如何进行两独立样本的t检验的。常规的做法是先比较基线,如果基线没有差异我们会直接比较干预后的结果;如果基线有差异,可以用倍差法,复杂一点用回归校正(协方差分析、直线回归)。重复测量只是把因变量由1个扩展为多个而已,可以把干预后的结果想象成一个整体,我们关注的是干预后的因变量变化,因此干预前的因变量值完全可以作为基线进行处理,如果这个基线在组间均衡,我们可以直接比较干预后的结果,如果这个基线在各组间有统计学差异则将其作为协变量纳入模型起到校正作用,或者把干预后的结果全部减去基线值然后进行差值的比较。
但是将基线作为协变量纳入模型时可能会碰到一个常常被忽略了的问题:多重共线。多重共线是在线性回归中常被提到的一个概念,实际上重复测量也在一般线性模型的范畴内。与基线相关的交互项与构成交互项的单变量之间可能的共线性。而且每增加一个因素都会增加模型的复杂度。另外,在没有干预的情况下,只是单纯地看下变化趋势,这种做法似乎就没那么有必要。当研究因素只有一个,或者只有一个为研究因素其他非研究因素只是为了校正的时候,考察组间的基线很容易。但当需要同时研究的因素比较多的时候,基线在要在各个因素中达到平衡也应该是以单元格为基础,或者说需要检验各个单元格内的基线是否有差异,这就需要以单元格进行分组。
如果将干预前的因变量值作为重复测量的一个数据点,可以分析干预前后观测指标的变化趋势。因为组间因素的主效应是把各次测量结果取均值来进行分析的,在分析中加入了基线的效应,可能会对结果造成一些干扰,尤其是组间基线差别较大的时候。从逻辑上讲,此时应该更关注一下组间因素和组内因素的交互项,交互项体现的是干预组的平均变化率与参照水平的平均变化率差值是否为0的统计学检验,如果这个差值不为0则代表干预对结果是有影响的。

主效应、单独效应和交互作用

单独效应(simple effect)是其他因素固定在某一水平时,某因素不同水平之间均数的差异;主效应(main effect)是某个因素各个水平的平均差异,等于因素单独效应之和的均值交互作用(interaction effect)则是某个因素单独效应之差的均值,表示一个因素的单独效应随着另外一个因素水平的变化而变化,变化幅度不能用随机误差表示。

当交互作用有统计学意义时,单纯关注主效应已经没有多大实际意义,而是需要进一步分析这些因素的单独效应,相当于各因素不同水平组成的单元格之间的比较。实际上,即使交互作用没有统计学意义,我们仍然愿意去分析单独效应。
重复测量数据的方差分析的适用条件
重复测量的方差分析具体方法包括单变量方差分析(UANOVAUnivariate ANOVA )和多变量方差分析(MANOVA,Multivariate ANOVA,又称多元方差分析)。Multivariate指的是多结局变量/因变量,翻译为多元、多变量,而Multiple或者Multivariable指的是多个解释变量、自变量,常翻译成多重、多因素。
重复测量设计的单变量方差分析具体采用的是一元裂区设计的方差分析(splitplot design),是将因变量视为对个体内因子水平的响应。方差分析一般都要求独立、正态和方差齐性。
重复测量单变量分析对正态性的要求是多元正态分布,要求受试者结果来自多元正态分布的总体。重复测量方差分析对违反正态性相当稳健,常常用受试者间因素形成的单元格中的因变量(严格说应该是残差)呈近似正态分布来代替多元正态分布的检验。由于重复测量个体内存在多个测量结果,测量结果在同一个时间点上存在方差,在不同时间点上就存在协方差。重复测量中要求的方差同质(homogeneity assumption)应该说有两个方面,当分析个体间因素时要求个体间因素形成的单元格内的因变量测量结果在各个时间点方差相等,另外还要求个体内的方差和协方差同质(球形对称)。SPSS中提供了Levene方差齐性检验。重复测量数据要求个体间是相互独立的,但由于发生在同一个受试者身上的多次测量结果之间可能是相关的,因此在采用方差分析时对多次测量结果的方差协方差有一定的要求。采用UANOVA分析时,要求个体间独立,也要求各次测量之间独立或者方差-协方差矩阵至少满足H型结构,注意应该是个体间每个水平的重复测量都应该满足H型结构,是否满足这个要求可以采用Mauchly球形检验,当数据不满足H型结构时,需要进行自由度校正(常用方法Greenhouse-GeisserHuynh-FeldtLower-bound)或者进行多元方差分析。
协方差与相关关系紧密,可以反应个体内各次测量之间的关系。
方差-协方差矩阵满足球形结构(sphericity),其对应的相关矩阵就是独立结构,即不同时间点上的测量值之间无相关关系。方差协方差的球形结构要求各个时间点测量值的方差相等(相关矩阵主对角线元素为1)、不同时间点测量值之间的协方差为0(相关矩阵非主对角线元素为0)。球形结构的另外一种考察办法是任意两点差值的方差相等。当个体内重复测量只有2个水平时,球形结构一定是满足的。
球形结构的要求太苛刻了。球形结构的方差协方差替代假设是复合对称结构(compound symmetry structure),其对应的相关矩阵结构是可互换结构(exchangeable correlation structure),复合对称结构要求方差相等、协方差相等但不一定为0
更为宽松的代替是协方差矩阵的H型结构,在重复测量情况下,不论同一个受试者的重复测量之间的相关关系如何,只要原始协方差矩阵满足H型条件[(方差i+方差j-2协方差ij)为常数]H型结构条件比球形结合和复合对称结构条件要求都要宽松一些,包含的结构也更多,但一介自相关和循环结构是不满足这一条件的。
球形结构的常用检验方法是Mauchly球形检验,H型结构采用的是正交对比的Mauchly球形检验。
个人理解:方差协方差矩阵满足球形结构或者复合对称结构也要求方差相等,但这里的关注的是个体内,要求的是不同测量时间点上的因变量方差相等、不同测量时间点上的协方差相等。而我们常说的方差齐性关注的是组间的方差。

多元方差分析对重复测量数据的结构无要求。重复测量设计的多元方差分析是把各个时间点测量的因变量结果打包成一个整体(作为一个矩阵)进行分析,各个时间点因变量方差-协方差类似无结构限制的结构。假定条件是观察对象之间相互独立、各单元格内因变量(残差)呈多元正态分布、方差-协方差矩阵齐同、因变量间存在一定的关联。多元正态分布的检验在SPSS里面并未提供,可参考STATAR中提供的方法:多元正态分布检验的STATA实现方法多元正态分布检验的R实现方法多元方差分析对多元正态分布的要求并不高,常弱化成各因变量(残差)的分别呈正态分布(边际分布)。方差-协方差矩阵齐同SPSS里面提供了BoxM检验,也提供了Levene方差检验。有书云BoxM检验受正态性的影响较大可能会不准确,且样本量较大时Box'M检验P值会很小,如果各组样本量大致相等(样本最大组与最小值样本量在1.5倍之内),MANOVA 对违反多元正态性和违反方差-协方差矩阵的同质性具有稳健性。观察对象之间的独立性和各因变量间的相关一般通过专业判断。

UANOVA还是MANOVA

还有一点需要特别注意,一旦涉及到多个分组因素,各种适用条件的考察将会转变成以各因素水平构成的单元格为单位。

SPSSGLM中的重复测量分析
SPSS中的重复测量的方差分析操作简便,可同时输出UANOVAMANOVA两种方法的结果。但SPSS过程也有一些不足的地方,比如最终构建的模型仅能自定义个体间变量(Between-Subjects),并不能对模型中涉及个体内变量(Within-Subjects)的预测项进行调整。再比如多元方差分析并没有输出个体间效应的多元方差分析结果,而是仅输出了个体内效应(包括重复测量因素、重复测量因素与组间因素的交互作用)的检验结果,当然这一项恰恰是单独进行多元方差分析时无法实现的,但我一直没弄清楚这里多元方差分析中组间和组内因素交互项的分析逻辑,既然MANOVA分析的是多个因变量打包成的矩阵,怎么又会有区别各个因变量的组内因素?
本次笔记演示SPSSGLM中的重复测量的分析操作,并试图单独运用一元裂区方差分析、多元方差分析得到这里复合输出结果中相应部分。尤其是一元裂区方差分析教程偏少,操作更少,少有的几篇教程也不能得到与SPSS重复测量分析一致的结果,花了好多时间才终于弄清楚。
示例:研究某种药物的三个不同剂量对两种类型的精神疾患(狂躁型和抑郁型)病人的治疗效果。每一种类型的疾病都给予了三个剂量的药物,每个剂量组5人,每个病种15人。分别在治疗前、治疗后1周、2周和3周测量患者的精神运动评分(NS)用以评估治疗效果。
SPSS变量名称与编码:id(患者编号)、Dis(疾病,1=狂躁型,2=抑郁型)、Dose(剂量,1=dose1,2=dose2,3=dose3),W0W1W2W13(治疗前、治疗后1周、治疗后2周、治疗后3周的精神运动评分)
GLM中重复测量方差分析
我们先考虑把治疗前的精神运动评分(NS)作为基线处理的情况。由于我们的研究因素有两个,一个是两水平的疾病,一个是三水平的剂量,可以形成6个单元格(狂躁型dose1、狂躁型dose2、狂躁型dose3、抑郁型dose1、抑郁型dose2、抑郁型dose3),以新变量Cgroup标识。
1、基线评估
评估治疗前W0在各单元格内是否均衡:分析>>比较均值>>单因素方差分析…
因变量选入W0,自变量选入新构建的单元格分组变量Cgroup
选项中选入方差齐性检验和Brown-Forsythe检验和Welch检验。当方差齐性不满足时,Brown-Forsythe检验和Welch检验结果优于方差分析结果。

本例也是满足正态性的,感兴趣的可自行检验。结果如下:W0(治疗前NS)在各单元格间均衡,无统计学差异(F=1.546,P=0.213)。

治疗前的NS在各因素间均衡,接下来我们对治疗后重复测量结果进行方差分析。
2、重复测量的方差分析
Analyze>>General Linear Models>>Repeated Measures
重复测量因子定义:个体内因素名称命名为time,水平数3,点击添加,测量名称命名为NS,点击添加。点击定义按钮,进入重复测量主对话框。
将重复测量的三个时间点W1W2W3选入因素个体内变量框,将研究因素DisDos选入个体间因素框。

本例W0在各单元格内无统计学差异,因此并未做特殊处理。如果W0在各单元格内不均衡,则可以按协变量放入协变量框。
【模型】构建个体间因素的组合模型,本例默认;
【比对】可对各个因素包括个体内因素进行多种形式的比较,其中多项式(Polynomial)比对是个体内因素的默认比对形式,结合轮廓图可以分析测量结果随时间的变化趋势。本例默认;
【事后多重比较】提供了众多的个体间变量均值多重比较方法,但无法进行个体内变量的比较,个体内变量的比较可采用[比对]或者[估算的边际均值]比较。边际均值和均值的区别可参见<<交叉设计资料的方差分析>>中的介绍。本例默认;

【绘图】大体查看变量的变化趋势及变量间的关系,实际应该作为分析前较为重要的一步。本例time选入水平轴,分别以DosDisSeparate Lines、以DosSeparate LinesDisSeparate Plots构建轮廓图,注意不要忘记点击添加,也可以添加95%CI等;
【估算边际均值】选中DisDostime及三者的交互作用,并采用默认的LSD进行多重边际均值比较。边际均值是基于当前模型,在固定了其他因素的作用后根据样本计算出的均值估计值。对于单因素模型、包含全部交互作用的全模型而言,边际均值就等于各样本各单元格的均值,但对不平衡的设计或者含有协变量的模型,原始均值已经不能正确代表各种组合下因变量的平均水平,应考虑使用边际均值进行比较。本例各组样本例数相同,组均值等于边际均值。
【保存】保存未标准化残差;
【选项】选中描述性统计量、效应量估计、观测功效、参数估计、SSCP矩阵、残差SSCP矩阵、齐性性检验、Spread vs. level图、残差图、拟合劣度。
描述性统计量输出均数、标准差等;

估计效应量计算模型和各因素的偏eat平方(η2)。方差分析中效应的大小定义为偏η2,表示在控制了其他因素的影响之后,该因素导致的变异(离均差平方和)占因变量总变异(总的离均差平方和)的比例,等于回归分析中相应偏回归系数的平方,取值0-1之间,实际很少能达到0.5;

检验功效输出各因素的检验效能,效能表示当两总体确实有差异按规定的检验水准α所能发现该差异的能力,一般需要80%以上,如果太低则表示即使总体确实有差异也检测不出来。通过该值可以得知试验设计的样本量是否充足;

参数估计输出模型的参数,参数系数、标准误、t&P值、置信区间等;

SSCP交叉乘积平方和矩阵,类似单变量方差分析中将总的离均差平方和(SS)分解为模型变异和误差变异类似,多元方差分析是将总的交叉乘积矩阵分解为模型SSCP矩阵(H矩阵)和误差SSCP矩阵(E矩阵);在选中残差SSCP矩阵后结果中还会输出Bartletts Test of SphericityBartlett球形检验常用于因子分析中判断变量间是否存在相关性,如果相关矩阵是单位阵(无效假设)则变量之间相互独立,如果拒绝原假设则表示变量存在相关性且偏离单位矩阵;

齐性检验(Homogeneity tests可输出方差-协方差矩阵齐性进行检验(Box'M检验),同时输出各组在不同时间点上的方差齐性结果;

Spread vs. Level plot输出的是均值和标准差或方差之间的关系。如果相对level(均值)差异而言,spread(标准差)差异不大,则可大体可判断假设方差在组间是同质的;

Residual plot输出观测值、预测值和标准残差的散点图矩阵,一个好的模型观测值和预测值应呈明显的线性相关趋势,而残差则随机分布y=0的上下;

拟合劣度(lack of fit),跟拟合优度(goodness of fit)个意思,用于评估当前模型与饱和模型相比是否具有统计学意义,尤其是在精简模型去除交互项的时候可以通过此项查看当前的精简模型是否能够刻画因变量与自变量之间的关系。

主要结果与解读

【基本信息】
结果首先给出个体内因子(Within-Subjects Factors)和个体间因子(Between-Subjects Factors)的概况,包括变量名称和样本量等信息。
描述性统计量(Descriptive Statistics)分别给出各个重复测量点上因变量在各单元格及汇总的均值、标准差和样本量。本例各单元格样本量完全相等,方差-协方差矩阵齐同违反与否结果相对稳健。

【个体间方差协方差矩阵齐性Box'M检验】

结果显示没有违背多元方差分析的协方差同质性要求件(P=0.123>0.05)。表格下方也表明了Box'M的无效假设:组间因变量的协方差矩阵相等(Tests the null hypothesis that the observed covariance matrices of the dependent variables are equal across groups)。

Bartlett球形检验】

在选项中选中残差SSCP(残差交叉乘积平方和矩阵)后,结果中会输出Bartlett球形检验,Bartlett球形检验常用于因子分析中的相关性检验,其无效假设是残差协方差矩阵与单位矩阵成比例(Tests the null hypothesis that the residual covariance matrix is proportional to an identity matrix)。多元方差分析要求因变量间存在一定的相关关系。本例P<0.001,表明本例残差间存在相关性且不满足球形结构。

【个体内因素多元方差分析】结果给出了重复测量个体内因素time、个体内因素time与疾病Dis交互作用、个体内因素time与药物剂量Dos交互作用、time*Dis*Dos二阶交互作用的多元方差分析结果。分别都有4个统计量,多元方差分析中常用WilksLambda 统计量进行推断,当违反模型假设时,Pillai'Trace最为稳健。本研究检验结果一致,当结果不一致时,以Pillai'Trace结果为准。
time主效应:WilksLambda F=7.093P=0.004,不同时间点上精神运动评分是不同的(至少有一个时间点的总平均值不同于其他时间点的总平均值)。但由于后面time与其他因素存在交互作用,单独看time的主效应已经无多大实际意义。
time*Dos交互作用:WilksLambdaF=2.771P=0.038<0.05,剂量和时间存在交互作用,剂量效应随时间的不同而不同。
疾病与时间,疾病、剂量和时间之间的交互作用没有统计学意义。
timeeta 平方值最大,表明时间因素解释了结果中最多的变异;交互项的检验功效不高,这就意味着实际有差异但可能没发现的几率比较高,检验结果并不是很可靠,需要加大下样本量。

多元方差分析的主要结果就上面这一张表,给出了个体内因素的分析结果,但并未给出个体间因素的分析,对于多元分析中总体有统计学意义的个体内变量,多重比较还是通过单变量的两两比较来实现(见后面的估计的边际均值)。所以SPSS里面的重复测量实际上是以UANOVA结果为主,MANOVA的结果只是一个补充,补充了一项单独进行MANOVA时没有分析的内容(MANOVA是将多个因变量打包成矩阵进行整体分析,并未给出重复测量因素及其与组件因素的交互作用结果),本例单独的MANOVA可参见后面的相应分析。
Mauchly球对称检验】:结果提示并不满足一元方差分析重复测量数据对球性对称的假设(χ2=6.332P=0.042),UANOVA的结果需要进行自由度校正,校正方法是自由度乘以表格后面的Epsilon校正系数。epsilons最高为1,最低为Lower-bound(本例为0.5),一般来说当epsilons<0.75Greenhouse-Geisser校正,epsilons0.75则用Huynh-Feldt。如果epsilons 很高时(接近1),表明数据结构接近球形,校正单变量重复测量 ANOVA可能会比多变量方差分析更有意义。

表格下方的说明提示无效假设是对数据进行正交比对变换后的协方差矩阵与单位矩阵成比例,所以该处的球形检验是对方差协方差H型结构的检验。从球形对称的要求上来说,球形结构应该是个体间因素每个水平上的各个因变量(残差)而言的,如此结果应该如下:

SPSS中只给出了1个结果,显然是一个总的判断结果,具体是什么算法不得而知,对于应用来讲也不需要。
【个体内因素的UANOVA:结果给出了满足球性对称时和不满足球对称时的三种自由度校正结果(校正方法是自由度乘以Mauchly球对称检验表中的Epsilon校正系数)。本例不满足球性假设,需要看后面三种校正的检验结果。若校正结果不一致,一般推荐Greenhouse-Geisser结果。本例分析结果的与上面的多元方差分析结果一致。同多元方差分析的结果一样,交互项尤其是time*Dis的检验功效不高,实际有差异但可能没发现的几率较高,检验结果并不是很可靠。

【个体内因素趋势比对(Contrast)检验】:本例采用的是多项式(Polynomial)比对,多项式比对输出的是统计指标随时间的变化趋势。重复n次的测量可最高配合到n-1阶多项式,H0假设是各阶次的回归系数=0,哪一阶系数具有统计学意义则表明曲线呈现该阶次的曲线变化趋势,所有阶次的系数的都没有统计学意义表明曲线变化趋势无差异。本例重复次数为3,最多可拟合2阶模型。结果表明不考虑研究因素,所有受试者的平均精神运动得分随时间呈线性变化(timeF=14.188P=0.001);Distime的交互项二阶系数具有统计学意义(F=4.787P=0.039),表明不同疾病患者的精神运动得分随时间变化趋势不同,差值呈二次曲线变化趋势,绘图上应该呈现两条曲线在两头差别相对小中间差别相对大一些;同样,采用不同剂量药物患者的精神运动得分随时间变化趋势也不同(F=4.608P=0.020)。

Levenes检验】提供了各个时间点上因变量残差在各单元格的方差齐性Levenes检验,结果显示治疗后1周和治疗后2周并未满足个体间方差齐同。

【个体间效应检验】:该表输出的是UANOVA的结果,结果DisDose的主效应以及两者的交互作用均无统计学意义。但是这几个变量的偏 eta 平方值都很小,表明这几个因素对结果变异的解释有限,而且检验功效都不高,需要加大下样本量来增加发现一些真实差异的概率。组间主效应是把各次测量结果取均值来进行分析的,因此如果组间因素与组内因素存在交互作用,组间因素的这种结果是没有实际意义的。

【参数估计值】:模型各解释变量的系数估计表是一个很有意义的结果。方差分析表能告诉你有没有差异,参数估计表可以具体的告诉你差异有多大,而且在含有交互项的参数估计表中,各系数的t检验代表的是单独效应是否有统计学意义。我们以DosW1的影响为例:对于抑郁型精神病患者而言,在给药1周后使用dose1剂量的患者精神运动评分(NS)比给药dose3的患者高28.8分,当然这个差异没有统计学意义(t=0.777,P=0.445);而对于狂躁型患者而言,在给药1周后使用dose1剂量的NS比给药dose3的患者低113.8(28.8-142.6),这个推断并没有直接给出检验结果。其他也可以做出类似的解释或者推断。当然这里的单独效应并不完整,比如我们能得到Dos1Dos2Dos3的比较,但如果你想比较Dos2Dos3,表格并未直接给出,但可以通过两者的95%CI是否重叠来大体判断,重叠则表示无统计学差异。

【交叉乘积平方和(SSCP)矩阵】结果中分别输出个体内、个体间与残差的SSCP矩阵。SSCP类似单变量分析中的方差。下图结果显示的是残差交叉乘积平方和矩阵。

【失拟经验(Lack of Fit)比较当前模型与饱和模型,显示多元方差、单变量检验、SSCP Matrix的模型拟合优度。因本例采用的是默认的全因子模型,当前模型就是饱和模型,因此未给出有效的比较结果。以单变量检验结果为例,结果如下:

【估算的边际均值(Estimated Marginal Means)

按设置显示DisDostimeDis*Dos*time的交互项的边际均值、标准误及95%CI。同时基于边际均值进行总体比较和多重比较,其中组间因素的总体比较采用的是方差分析,组内因素采用的是多元方差分析。交互项仅显示基本的描述性统计信息,不进行比较。time为例, 不同时间的NS不同(F=7.093P=0.004),其中治疗后1周与治疗后2周、治疗后1周与治疗后3周的差异具有统计学意义,而治疗后2周与治疗后3周的差异并无统计学差异。

Spread-versus-Level Plots该图我们在《多因素方差分析前的正态性和方差齐性考察》做过解读,实际上是单元格均值和标准差/方差的散点图。下图以W1为例,展示了均值和标准差的散点图,相对均值(100-210)而言,标准差波动范围(10-70)并不算大,基本或近似满足方差齐性。 

【观测值、预测值与标准化残差的矩阵图】一个好的模型观测值和预测值应呈明显的线性相关趋势,而残差则随机分布y=0的上下。本例W1W2W3的观测值与标准化残差均有明显的直线关系,提示模型拟合得并不好,还有一些变异模型未能解释到。

【轮廓图(Profile Plots)结合前面的趋势分析,可以查看随着时间的延长精神运动评分的变化趋势。也可以在设置中添加标准差或者95%CI,有助于判断是否有差异。

总体来说,该模型对结果变异的解释有限,检验效能也不高,结果并不具有很好的参考意义。为了更好的演示SPSS的操作,我们继续下一步。
3、模型简化
上述全因子模型分析表明,模型中的交互项Dis*Dos并无统计学意义,我们可以将其去除做进一步的模型精简,步骤和主要结果如下:

结果显示:因变量之间存在一定的相关关系,数据满足方差-协方差矩阵齐同和球性假设。组间DisDos主效应不具有统计学意义,组内time主效应具有统计学意义,交互项Dos*time具有统计学意义。

交互作用具有统计学意义后,单独效应的比较可以使用菜单或者程序。使用菜单时,需要先选择个案或者拆分文件,然后再进行边际均值估计。方法可参见<<重复测量数据的方差分析>>一文。程序方法也比较简单,只需要对EMMEANS子句进行修改就可以了,如比较不同疾病不同时间点下,不同剂量之间的NS差异,采用Bonferroni法进行两两比较,修改命令如下:
/EMMEANS=TABLES(Dis*Dos*time) COMPARE(Dos) ADJ(BONFERRONI)

4、基线做为协变量进行校正
当基线在各单元格内不均衡时可以考虑将基线作为协变量处理,操作上只需要把W0放入协变量框即可,其他同前面模型,具体步骤如下:

该模型的方差-协方差矩阵齐同,但不满足H型结构,主要结果如下:

该模型跟不纳入无统计学意义的基线模型结果并不完全一致,尤其是疾病类型。相比而言,该模型的检验效能更高,但会存在前面我们讲过的一些问题,孰是孰非后面我们再找机会去深究一下。

5、采用差值(干预后结果减去基线值)作为新因变量进行比较

差值比较也是处理基线的一种方法。用干预后的结果减去基线值作为新的因变量,其表示相对基线的增加/减少值,然后对差值进行重复测量的方差分析。

该模型的方差-协方差矩阵齐同,也不满足H型结构,主要结果如下:

该模型跟将基线作为协变量进行校正的模型结果类似。

6、治疗前的基线数据做为一个重复测量的点
如前说言,这种方式处理方式可分析干预前后观测指标的变化趋势,但对组间因素的主效应的计算可能存在一些误差,个人觉得对交互项的解释更有意义。

该模型满足方差-协方差矩阵齐同,但不满足H型结构,主要结果如下:疾病和剂量的主效应无统计学意义,但时间主效应存在统计学意义,不同的疾病不同时间点上的精神运动评分不同。时间呈二次项变化趋势,疾病和时间的交互项也呈二次项变化,剂量和时间的交互项呈三次项变化趋势。当然这个模型还可以进一步简化。


7、多元方差分析
多元方差分析是把各个时间点测量的因变量结果打包成一个整体(作为一个矩阵)进行分析。直接进行多元方差分析时,并不能进行组间因素与组内因素交互作用的分析。MANOVAUANOVA分析的思路是一致的,都是变异分解。单变量方差分析是针对一个因变量的方差进行分解,用组间均方与组内均方相比较,看组间变异(分组因素效应)是否大于组内变异(随机误差);而多元方差分析是针对多个因变量的方差-协方差矩阵进行拆解,是将总的交叉乘积矩阵(CP)分解为模型SSCP矩阵(H矩阵)和误差SSCP矩阵(E矩阵)。
MANOVA结果具有统计学意义时,结果中还会输出单变量的方差分析结果,但有些统计学家认为不必报告或者解释这些单变量分析的结果,因为即使MANOVA不显著,也可能会存在一个或多个ANOVA显著,反之亦然。单变量的ANOVA并不能揭示显著的MANOVA为何显著,当然会有人会想知道每个变量在组间是否有差异,这些单变量的ANOVA可提供这些信息。除非整体MANOVA显著,否则不查看单独的ANOVA的结果,这种做法确实可以减少进行性ANOVA下的I类错误。
SPSSGLM中重复测量分析结果中显示的多元方差分析是组内变量及其与组间因素的交互作用,并未显示组间因素的多元方差分析结果。如果感兴趣这方面的结果,可以直接使用多元方差分析进行查看:
Analyze>>General linear model>>Multivariate

8、一元裂区方差分析
很多教程中都提到了重复测量资料可采用裂区设计的UANOVA进行分析,但是裂区设计的方差分析实操教程并不多。SPSSGLM提供的重复测量过程会直接输出单变量方差分析结果,使用裂区设计的方差分析来完成重复测量资料的分析就显得没有必要。现有的一些SPSS教程采用的裂区方差分析也未得到与GLM重复测量过程完全相同的单变量分析结果。SPSS中这个重复测量过程以单变量方差分析为主,辅以多元方差分析,操作简便,可直接提供球形检验、方差-协方差矩阵齐同性检验等,但这个过程只能自定义构建组间因素的交互项,而与重复测量的组内因素相关的交互项都是默认构建好的,并不能进行自定义。
要在SPSS中直接采用一元裂区设计的方差分析来分析重复测量数据前,需要对数据结构的重建:在SPSS中进行重复测量过程和多元方差分析过程时,各个时点的因变量都是单独作为一个变量来录入的,如下图。但在进行单变量分析时,各个时点的因变量需要合成一个因变量,手动赋值录入也不难,也可以采用数据结构重建的过程来完成(Data>>Restructure…),完成后可以对一些默认的赋值进行修改(Transform>>Recode into Same Variables…),具体操作步骤如下:

裂区设计实际上是一种特殊的区组设计,是在区组设计的基础上对区组进行裂区,分裂成裂区来分配二级因素。重复测量资料可以看做先将受试者按照组间因素的水平数(组间因素个水平形成的单元格数)进行分组,然后再在不同时间点上对组内的个体进行结果的测量。

很显然,个体嵌套于组间因素之内。很长一段时间我一直把嵌套当做是嵌套设计独有的一种设计,但实际上在这种变量之间的关系广泛存在。
Data>>Select Cases:选择time>0的个案,具体步骤如下:

Analyze>>General Linear Model>>Univariate
因变量选入NS,固定因子选入DisDostime,随机因子选入id
【模型】中进行自定义模型,我们选择跟重复测量过程中一样的变量。需要注意的是id也需要选入模型,而且id嵌套于DisDos,菜单操作如下图所示。也可通过【Paste】直接对DESIGN行的程序修改如下:

DESIGN=Dis Dos Dis*Dos Dis*time Dos*time Dis*Dos*time id(Dis*Dos)

结果如下,同重复测量过程完全一致,不再累述。

我们在第2步建立精简模型时发现,SPSS中的重复测量只能自定义组间因素,却不能定义组内因素的交互项。我们建立的这个精简模型,实际上Dis*time也是没有统计学意义的,如果想进一步进行模型的精简,可以单独使用UANOVA

交互作用具有统计学意义,需要分析单独效应,方法前面已经提过了,可用菜单也可以修改程序命令。

不过这里仍有一个问题未能解决,当有协变量时,这种方法未能输出和GLM中重复测量过程一致的结果,根本原因应该是协变量默认采用组内随机误差,多次尝试修改命令未果。此次笔记有多处可能存在争议,也欢迎各位同道批评指正共同探讨。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
R语音实战笔记
配对t-test
Review:1.生信基本统计方法
Stata中的空间计量回归模型应用
数据分析中常见的七种回归分析以及R语言实现(一)
[机器学习]机器学习笔记整理12
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服