会计学术联盟第七期Seminar(湖北经济学院,5月28日)征稿
5月12日截稿
青年会计学者联合发起的会计本硕博NO.1平台
分享信息,传正能量,交流学术
广结善缘,整合资源,服务成长
以下讨论整理自会计学术联盟—SSCI/CSSCI微信群,感谢参与讨论的各位专家、学者,想加入群的朋友请往后看,有申请入群方式。
模型中的加入交乘项后
变量符号变异问题浅析
假设一个模型1有因变量Y和两个自变量X1和X2组成,在模型1的自变量中加入一个交乘项(X1*X2)构成模型2,在某些情况下,我们可能发现模型1和模型2中的自变量X2的系数符号变了(正变负或负变正),而且分别在两个模型下检验都还显著。这是为什么呢?
这是因为模型1和模型2的回归系数含义不同导致的,实际上,模型2是将模型1残差中未考虑的因素中拿出一个交叉项因素,此时模型2中的X2的系数已经模型1中X2的含义有所不同,对模型1、2分别对X2求偏导数,模型1中是的X2的偏导数是就是X2的系数,而模型2的X2的偏导数应该是X2的系数和交乘项的综合系数,也就是说此时模型1、2中系数的正负号不具有可比性。这是数学解释,下面我可以采用模型意义解释。
在模型1的情况下,X2可能在X1较低时对Y的影响是正的,在X1较高时是负的,平均情况下是负的,因为负的效应可能主导了正的,加入交乘项之后,把X1较低时的效应分离了出来,X2的回归系数就会变成正的了;在模型2中,加入交乘项之后,把X1较低时的效应分离了出来,X2的回归系数就会变成正的了。但是,只要模型1、2中,X2的系数符号发生了变化,就说明X1、X2和X1*X2三者之间存在多重共线性问题。
举个极端例子,Y是杀死的敌人数量,X2是炸弹变量,X1是是否叛徒变量,在不是叛徒的情况下,炸弹越多,炸死敌人越多,如果是叛徒(X1=1),则会杀自己人去了,敌人(Y)反而杀得越少,当加入交乘项时,X2的回归系数表示在不存在叛徒的情况下,炸弹(X1)数量等增加会对杀敌(Y)产生什么影响,如果不加交乘项,表示的是平均情况下炸弹(X1)的增加对对杀敌(Y)的影响,但是,平均条件下叛徒和非叛徒是混在一块的,如果叛徒够多,叛徒效应主导了非叛徒效应,则在不加交乘项时,X2的回归系数可能是负的,而加入了之后,就变成正的了。
加入交乘项类似分组,可以看下两组是不是样本观测值差异很大?通常看到的是不加交乘项不显著,加入交乘项有结果,即便符号相反,从计量上看,也可能没有问题,因为不同组别下,确实可能X2对Y的影响不同,而x1=1的占据了主导地位,所以在分析系数时更多的应该从理论上看结果能否解释的通。
联系客服