打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
30天打卡学习医学统计与SPSS(Day 11):多组率比较的统计方法​

30天打卡学习医学统计与SPSS

欢迎诸位一起学习医学统计学与SPSS操作方法,我将每天一篇、大概30篇推文左右,讲述基于不同医学研究类型的各种统计分析策略,诸位可以结合视频、SPSS操作录屏、文字版教程进行学习。如果你能跟得上节奏,我相信,在一个月后,您将会掌握医学数据分析。

1. 打卡所需的SPSS全套视频、数据库、讲义下载(点击链接)
寒假到来宅们来学习统计吧!无偿奉上我们精心制作的医学统计学全套资料【配字幕】

2.如果您真的能够坚持,发送关键词“打卡”,加入微信打卡群吧。骗人?不存在的。作为高校老师,你们能够学会医学统计学,我将视为这是一种成就。
公益免费课程新一期:
公益课程“30天学会医学统计与SPSS”再次开课,欢迎入群打卡学习!

Day 11: 多组率比较的统计方法

隶属第三章:实验性研究定性数据的统计分析策略

从第10日开始,介绍实验性分类数据结局的统计分析方法。第10日介绍了两组二分类结局的比较,即两组率的比较,俗称四格表资料的统计分析。分类数据除了2*2的交叉表之外,还有诸多其他形式,比如多组率的比较、2组构成比的比较、甚至多组构成比的比较。它们数据结构更为复杂,虽都采用卡方检验为主要方法,但细节方面与两组率的分析上有所区别。

实例分析


·案例1:某医院将研究对象随机分为三组,用三种方案治疗轻中度新冠肺炎患者254例,观察结果见下表,问三种方案治疗新冠肺炎患者的有效率是否不同?数据详见Coid19.sav

案例2:为了解案例1临床试验中,中药、西药、中西药三组新冠肺炎患者的基线方面,有无差异,研究开展对吸烟状态进行了分析,问比较各组吸烟构成有无差别?

案例3:为了不同孩子的意外伤害,分别比较了有行为问题的儿童和无行为问题的儿童的数据,请问两组儿童意外伤害类型的分布上有无差异?


1



案情分析

上述3个例子结局均为分类数据(效果、血型、意外伤害类型),汇总数据形成的三线表称为多行多列交叉表或者行列表区别就在于,案例1结局为二分类结局,案例2为多分类结局,案例3则是2组多分类结局。因此,第1个例子为多个率的比较,第2个例子为多个构成比的比较,第3个例子则是2个构成比的比较。


2



统计分析策略

多行多列交叉表数据的分析,或者说多个率、构成比,乃至两个构成比的比较,四格表资料的分析策略一样,均可以考虑卡方和Fisher确切概率方法进行。

但是细节方面,与四格表资料的分析策略有所不同。

第一,多行多列交叉表分析没有校正卡方。具体应用条件如下:

1.不超过20%单元格的理论频数(期望频数)T < 5时,可使用卡方检验进行比较。

不超过20%的T < 5,卡方检验

2.如果超过20%单元格的理论频数(期望频数)T < 5,或者至少一个T<1,此时采用的是Fisher确切概率法

n40或至少1T <1 ,Fisher确切概率法

第二,多个率、多个构成比的卡方检验存在多重比较的步骤

多个率、多个构成成比较,就如方差分析一样,当P<0.05时,只能说明总体上存在着统计学差异,还不能说任意两组都有差异,需要多重比较进行进一步分析。

总的来说

利用SPSS进行卡方和Fisher法检验

本文SPSS以第一个为例开展多行多列资料的统计分析。

·案例1:某医院将研究对象随机分为三组,用三种方案治疗轻中度新冠肺炎患者254例,观察结果见下表,问三种方案治疗新冠肺炎患者的有效率是否不同?数据详见Coid19.sav


1



交叉表分析入口界面

分析-描述统计 -交叉表


2



交叉表分析对话框

在“交叉表”对话框中,分别选择分组变量和结局变量到“行”和“列”中。

:行” 和 “列”分别放哪个变量没有规定,结果是一致的(分组变量可以放“行” ,也可以放“列”中)。

 精确:点击选择“精确”选项,进行Fisher确切法检验

统计:选择“卡方”,进行卡方检验

单元格:选择计算百分比中的行与列,不必同时选择,选择一项即可。一般建议与交叉表的分组变量所在的行”“列”位置一致。


3



统计分析结果与解释

结果主要为2张表格。

第1表:分组统计描述结果,分别给出,各处理组的结局,包括发生数以及相应的百分比。本例西药有效率51.8%,中药44.7%,中西药75.0%。

第2表:卡方和Fisher确切检验的结果。该结果同时展示了卡方、和Fisher确切概率分析结果(无校正卡方),也显示了总样本量、理论(期望)频数的情况。

首先要关注理论(期望)频数。理论(期望)频数在表格下方第一个注释a。注释a前半句说的是多少单元格期望计数小于5,后半句指出最小期望计数。注释a将决定采用卡方检验还是Fisher确切概率法。

卡方检验,不超过20%的格子理论频数(期望频数)T < 5时,选择第一行的“皮尔逊卡方”,得到卡方值①,选择P值(渐进显著性双侧)②。

Fisher确切概率法,如果超过20%的格子理论频数(期望频数)T < 5,或者至少一个T<1,选择第三行的“费希尔精确检验”,选择P值(精确显著性双侧)①。

对于本例,样本量254,0单元格(0%)期望计数小5,最小为36.05,应选择一般的卡方检验,卡方值16.30,P<0.001。两组人群的有效率存在着统计学差异。

卡方检验多重比较


多组比较,无论均数、还是率、还是构成比,均有多重比较的方式。像方差分析多重比类似,卡方检验多重比较也有两种方法。一种是软件自带的Bonferroni 方法,一种是手工a分割方法(其实两种方法结果一致)。前者方法简单,但在SPSS结果表达上反而有些时候不好理解。所以卡方推荐我推荐a分割方法。

比如3*2交叉表,即3行2列数据,3个率的比较。上文已经证明、中医、西医和中西医结合疗效总体有差异,那么到底那两组有效率相同,哪两组不同呢?

这个时候,我们可以分别开展比较中医 vs 西医、西医vs 中西医、西医vs 中西医,即三次两两比较。

此时两组、即两个率的比较,当然可以采用卡方检验。但是,特别注意的是,检验水准a不再是0.05,而是除以同时比较的次数,即a=0.05/3=0.017,P<0.017才被认为差异有统计学意义。


结果及表格的规范表达


根据上表,我们可以得到以下的规范的结论:

规范文字:西药治疗新冠肺炎有效率为44.7%38/85),中西药有效率为75.0%(63/84),三组数据/均数存在着统计差异(c2 =17.30P<0.001)。西药有效率与中药相比,无统计学差异(P>0.05),中西药与西药、与中药均存在着统计学差异(P<0.05)。

规范的统计表(其中一种形式)为:

总结与拓展知识

1.四格表卡方和多行多列资料在统计分析策略的区别

·四格表

Øn≥40T ≥ 5,卡方检验;Øn≥40,至少一个1≤T ≤ 5 ,卡方校正检验;

Øn40或至少1T <1 ,Fisher确切概率法。

·多行多列表

Ø卡方检验:行列表中的各格T≥1,并且1≤T5的格子数不宜超过1/5格子总数

Ø否则采用Fisher确切概率法。

因此,多行多列表格没有校正卡方的统计推断方法。

2. 多组率或构成比比较必须精简行列数

很多开展多行多列交叉表统计分析时,往往形成了超过3*3的格子数,比如5*4、4*6等。比如,要分析比较不同文化程度与满意率的关系,得到以下结果:

这是5*3交叉表,在实际分析中并不罕见。很多问卷调查的原始数据,数据很分散,由于选项类别比较多,比如问教育经历时,答案不止5类,还可以是6类,7类,如果原始数据直接拿来做卡方分析时,往往形成多行多列的交叉表,而结果往往不容乐观。原因如下:第一,多行多列表格在数据陈列上密密麻麻,看得人眼花缭乱,更看不透其数据的分布规律。这样的统计报告,很难得到读者的认可。第二,由于数据分散,单元格数量增加,无论是卡方检验还是Fisher法,不容易得到阳性结果。

因此,对于过多的行列表,必须开展整合或删除工作。可以考虑两种策略,第一种,可以合并属性相似,且样本量都较少的行或者列,比如本例的初中和高中可考虑合到一处。第二种方式,删去不必要的行或者列。本例中,“不知道”的人群可以考虑删除,它的存在可能干扰“不满意”和“满意”的统计学差异性。

诸位,当你们拿到一份原始数据时,千万别直接开展卡方检验,请认真思考如何整理数据,如何精简行、列,使得行列数控制在一定的数量以内,比如行列表总的单元格数不能超过10格,一般限制在3行、或者3列及以内为妙。

3. Fisher检验卡壳了怎么办? 

多行多列资料,单元格过多,会造成Fisher方法无法得到结果。我依然以“不同文化程度与满意率”的关系为例(将样本量乘以10),开展统计分析。

然后,Fisher就卡壳了,无法计算,同时造成卡方检验结果耗费长时间才能得到。

这种情况,主要原因就是小型计算机运算能力有限,分析大样本多行多列资料时,搞不定Fisher检验方法。

有以下几种策略可以解决本问题:(1)不要进行精确检验 ;(2)行列合并或删除精简行列数;(3)选择蒙特卡罗精确法:

SPSS 操作视频

-本讲结束-

更多信息:

本公众号作为医学数据分析公众号,提供一些免费医学统计学学习资源下载,欢迎点击下载。
1.免费下载!统计初学者的福音!《妙趣横生统计学》视频,生动有趣的统计学!
2.医学研究样本量如何计算?原创高清教程视频来了,完全免费下载!
3.绝对值得收藏!原创高清SPSS 操作视频免费下载
4.推荐!这个流行病大神制作的公共卫生研究小工具,可以计算标准化率及置信区间
5.2006-2020中国卫生统计年鉴完整合集免费下载
6.全网最简单的SPSS教程,160页PPT学会SPSS统计分析!免费下载!
7.“如何在90分钟学会统计分析?” 来下载PPT学习吧!还有免费直播视频
特别提醒:上述列表资源每天限分享和下载一个。


如果您觉得文章不错,
为我们打“call”,
点击“分享”
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
发生在我身边的 SPSS 应用
干货 | 利用SPSS进行高级统计分析第一期
练习Stata:交叉表与卡方检验
流式统计分析前,不该忽略的问题
医学论文中如何描述统计方法和统计结果
如果我早知道这些统计学误区,又何至于文章屡屡被拒!
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服