导读
在日常工作中我们会遇到这样的问题:
工艺中发现突发情况得到若干批次检验结果,怎么样来确定该突发情况是否影响到了检验结果?
某产品质量回顾时发现,有关物质水平有所升高,调查可能原因,发现干燥工序的温度设定的范围为60-80℃,以前批次一般控制为65℃,后来增大批量,为提高效率,将温度设定到了70℃,怀疑有关物质升高可能与干燥温度有关,怎么确定这二者之间存在关系?
企业所用的某原料的含量检测指标满足正态分布,质量回顾得出前一供应商提供物料周期的平均值μ=99.5%,现有一新供应商提供的该原料,样品9次检测结果分别为:98.1%、99.0%、99.5%、98.8%、99.4%、98.5%、99.2%、99.0%、98.9%,如何判断新供应商该原料含量指标与原供应商是否相同?
在不同条件下得到了某一指标的两组数据(见本文应用举例),我们想知道两组数据间是否存在显著差异?或者该条件(参数)是否为影响这一指标结果的主要因素?
昨天我们介绍了质量管理工具“过程能力分析”,今天我们继续对另一质量管理工具——“显著性检验”进行介绍。
正文
显著性检验:是以小概率反证法的逻辑推理,判断假设是否成立的统计方法。事先对总体(随机变量)的参数或分布形式做出一个假设(相同),然后根据统计量的分布规律来分析样本数据,利用样本信息来判断是否支持这个假设(备择假设),并对检验假设做出取舍抉择,即判断总体的真实情况与原假设是否有显著性差异,注意所做出的结论是概率性的,不是绝对的肯定或否定。
今天就给大家介绍下在医药领域应用最多的一种显著性检验方法——t检验。
二、t检验
定义:
t检验,亦称studentt检验(Student's t test),是用t分布理论来检验一个样本平均数与一个已知的总体平均数,或两个样本平均数与其各自所代表的总体的差异是否显著。
应用条件:
当总体分布是正态分布,如总体标准差未知且样本容量小于30,那么样本平均数与总体平均数的离差统计量呈t分布;当两样本平均数比较时,两总体方差齐性(相等)。
可能的应用场合:
1.单总体t检验:主要用于判断一部分数据相较于总体是否有显著差异。比如,工艺中发现突发情况得到若干批次检验结果,可以通过t检验与一段时期内总体数据进行显著性检验,来确定该突发情况是否影响到了检验结果;(例1)
2.双总体独立样本t检验:主要用于判断两组无一一对应关系的数据之间是否有显著差异。比如,某一参数设置不同分别得到若干批次产品,通过对某一项目检验结果进行t检验,确定该参数是否为影响这一检验项目的显著因素,例如两个合成反应温度,得到的若干批产品分为两组,对有关物质检验结果进行t检验可以判断反应温度是否为影响有关物质的显著因素;(例2)
3.双总体配对样本t检验:主要用于判断两组相互配对的数据之间的显著差异。比如,若干产品经过处理前、后的某一质量指标的数据,通过进行t检验可得出该处理方法是否显著影响该质量指标;或若干产品分为两组,分别经过A工艺、B工艺处理后,所得某一指标的结果经过t检验,判断A、B两工艺处理结果是否具有显著差异。(例3)
分类:
t检验分为单总体检验和双总体检验。
单总体t检验是检验一个样本平均数与一个已知的总体平均数的差异是否显著。
其中:为样本平均数;μ为总体平均数;为样本标准差;n为样本容量
双总体t检验是检验两个样品平均数与其各自所代表的总体的差异是否显著。双总体t检验又分为两种情况,一是独立样本t检验,一是配对样本t检验(相对于独立样本,配对样本要求两组观察值数目相同,顺序不能随意改动,具体举例说明)。
独立样本t检验:
其中:S1、S2为两样本方差;n1、n2为两样本容量;SR为合并标准偏差
配对样本t检验:
引入新的随机变量Y=X1-X2即为两个样本相对应的观测值的差值。
则得到对应的样本值yi=X1i-X2i(i=1、2、……,n),这样就转化为单总体t检验问题,相对应总体平均值为0(即转化为检验Y的平均值和0的显著差异),将μ=0代入公式,即
显著性检验的一般步骤:
显著性检验的一般步骤为:设置“原假设”为样本与总体间不存在显著性差异(即μ1=μ2),则“备择假设”为样本与总体间存在显著性差异(双侧检验μ1≠μ2;单侧检验μ1>μ2或μ1<μ2);通过计算出的值与临界t值(t0)进行比较(t0通过查临界值表得出,见附表1)如果≤t0则原假设成立,两者不存在显著差异,反之存在显著差异。
概括来讲,可以分三步进行:
1.建立检验假设和确定检验水准
2.选定检验方法并计算
3.做出推断结论
双侧检验与单侧检验:研究者通常有两个目的,一是推断两个总体均数有无差别,不管是一组大于/小于另一组同样关心,应该选择双侧检验。另一种情况是在已知一组数据不可能大于(或小于)另一组情况下,只关系一组数据是否显著小于(大于)另一组时,选择单侧检验。
检验水准:显著性检验还需根据不同研究目的事先设置是否拒绝原假设的判断标准,即检验水准(α),也称显著性水准,它指原假设实际为真,但被错误地拒绝的一个小概率值。一般取α=0.05
附表1 t分布临界值表
V指自由度,并分单侧和双侧两种类型
应用举例:
例1:企业所用的某原料的含量检测指标满足正态分布,质量回顾得出前一周期的平均值μ=99.5%,现有一新供应商提供的该原料,样品9次检测结果分别为:98.1%、99.0%、99.5%、98.8%、99.4%、98.5%、99.2%、99.0%、98.9%,判断新供应商该原料含量指标与原供应商是否相同?
1、建立假设,原假设为样品与总体均值相同无显著差异;备择假设为有显著差异;判断属于双侧检验,取检验水准α=0.05。
2、计算统计量:
3、由于,得出结论:两者存在显著差异。
单总体t检验还可能用于以下几个情况:
1、某稳定工艺中,若干批次发生某些改变时,如设备等临时更换;
2、工艺中发生偏差,在进行影响分析时,如干燥时间超常,对水分、含量、有关物质等指标与以往数据进行t检验判断是否有显著差异。
3、确定某一参数是否为影响某一检验指标的显著因素,如反应时间对杂质的影响(注:双总体t检验也有此应用,只是需要原始数据不同,单总体是部分个体与总体比较,而双总体是两个个体之间比较,详见例2)
例2:某产品质量回顾时发现,有关物质水平有所升高,调查可能原因,发现干燥工序的温度设定的范围为60-80℃,以前批次一般控制为65℃,后来增大批量,为提高效率,将温度设定到了70℃,怀疑有关物质升高可能与干燥温度有关,为进行进一步确认,QA用同一批次产品,对干燥工序进行了测试:取6份样品分两组,分别在65℃和70℃进行干燥,然后测试其有关物质,统计如下表:
数据 | 1 | 2 | 3 |
65℃ | 1.23 | 1.25 | 1.26 |
70℃ | 1.31 | 1.34 | 1.35 |
1、建立假设:“原假设”两组数据不存在显著差异(即干燥温度不是有关物质的变化的显著因素);判断为双侧检验,取检验水准α=0.05;
2、计算统计量(公式参考双总体独立样本t检验):
自由度V=n1+n2-2=4,查表得t0.05,4=2.776
3、结果判断:结果t值(5.81)>t临界(2.776),因此认为两组数据之间存在显著性差异。因此,可以得知,温度的变化是影响有关物质变化的一个主要原因。
例3:某检验项目测定一直采用A方法,后计划改用B方法,为判断两种方法的差别企业选取了10个样品,分别用A、B方法进行检验,统计如下:
1、建立假设:原假设差值d的平均值为0(参见配对样本t检验);双侧检验;α=0.05;
2、计算统计量:自由度V=9;差值d平均值μd=0.010;S=0.145,t=0.069,查表得临界值t0.05,9=2.262
3、由于t<t0.05,9,原假设成立,故不能认为两种检验方法有显著区别。
联系客服