一、直接手工套公式计算
1,三个基因类型(genotype)实际数(O):注:O为英文字母,非数字
AA---AB---BB
1787 30391303总数N=6129
2,等位(allele)频率
F(A) =(1787*2+3039)/(6129*2) = 0.54 = p
F(B ) =(1303*2+3039)/ (6129*2) = 0.46 = q
3,期待genotype频率:
期待AA频率:p2= (0.54)2 = 0.2916
期待AB频率:2pq= 2x 0.54 x 0.46 = 0.4968
期待BB频率:q2= (0.46)2 = 0.2116
根据Hardy-Weinberg定律,P2+2pq+q2=1
4,期待genotype频数(Q):
期待AA : p2N = 0.2916 * 6129=1787.2
期待AB : 2pqN = 0.4968 * 6129 =3044.9
期待BB : q2N = 0.2116 * 6129=1296.9
5, 卡方值
X2=∑(A-T)2/T=(1787.2-1787)2/1787.2+(3039-3044.9)2/3044.9+(1296.9-1303)2/
1296.9=0.040
按自由度=2,查X2界值表,P>0.05(自由度是2,只要卡方值小于5.99,对应的P值都是大于0.05),因而不能认为这两组数据有显著性差别,也即该样本达到了遗传平衡。
二、借助于软件
1.STATA软件
例如:三个不同的基因类型的实际数:
AA---AB---BB 50 110 43 549 762269(分别是病例组和对照组的基因数)
在STATA中输入一下命令
genhwcci 50 11043 549 762 269
结果如图1所示:从结果中发现,软件给出了二种计算HWE检验的方法,一种是Pearson卡方,一种是似然比卡方,结果相差无几,我们只要取其中一种就可以了,P>0.05。
2.R软件
我们可以借助R软件的”genetics”包中的genotype和HWE.chisq函数来进行HWE检验。
例如:三个不同的基因类型的实际数:
AA---AB---BB 549 762 269
R软件汇报的具体的结果如图2,其实就是卡方检验的延伸,我们发现结果和STATA汇报的差距不大,最后的P>0.05。
QQ讨论群:422021477
联系客服