近些年来,在我国的国际关系实证研究中,学界对于研究方法的应用水平明显提升,采用回归模型的规范性日渐加强然而,在应用诸多回归模型辨析不同变量间的关系时,读者难免对其统计结果可靠性以及结果是否具有偶然性产生疑问。
因此,在对数据进行回归分析后,研究人员还需进行一系列检验,下文将对稳健性检验进行重点分析稳健性检验(robust check)是回归模型中常用的方法,用以帮助判断回归结果是否可靠如果某一回归模型中关键自变量的回归结果具有偶然性,那么对该模型略作调整后,该核心自变量的显著性或系数方向可能出现明显变化。
稳健性检验重点尝试解决的问题是内生性问题,亦即模型中的自变量与误差项相关的问题导致内生性的原因主要有遗漏变量、样本选择、双向因果和测量误差问题等,以下是稳健性检验的一些常用做法
第一,增减控制变量或更换指标为了确保回归结果的可靠性,我们可以对回归模型做适当的调整,如增减控制变量、更换自变量操作化指标或因变量衡量指标在调整后的新模型中,若核心自变量的系数方向与显著性没有重大变化,则可以认为通过了稳健性检验,核心自变量与因变量的关系是比较可靠的。
例如,在研究不同政体下冲突风险的影响时,因变量“冲突”除了可以采用国家间军事争端(Militarized Interstate Disputes, MID)数据,也可以采用国际危机行为(International Crisis Behavior,ICB)数据进行检验。
此外也可以增加或减少控制变量,诸如国内稳定程度、贫富差距、发生冲突两国历史纠葛等变量均可纳入模型还有一个选择就是改变模型例如,分析不同政体下冲突风险时,在采用面板Logit模型后,还可以采用泊松回归、负二项回归或Tobit回归等模型进行检验,以判断回归结果是否稳健。
第二,对选择效应的处理选择效应是指研究样本可能不是随机的,而是已经经过了主观选择的结果例如,在研究领导人的军事经历对其发动战争的影响时,其假设是:领导人青年时期在军队经过历练锻炼了勇气,不再惧怕战争,因此在其成为国家领导人后,若国家面临战争危险,则软弱退让的可能性较小。
若数据回归结果中核心自变量“领导人的军事经历”在模型中显著,也不能说明数据结果印证了假设,因为此处样本可能存在选择偏差一种选择是研究样本是否选择参军,如果有些国家不需要全员参军,则是否参军就是个人的选择。
而选择参军的人往往对军事活动有偏好,因此,之前所谓的军队生活锻炼了勇气的作用机制可能就无法发挥作用,取而代之的是偏好机制,即偏好战争的人选择参军,在其成为领导人后也倾向选择战争第二种选择是研究样本是否成为国家领导人,因为成为国家领导人是得到该国精英和民众支持的结果。
因此另一种可能的作用机制是民众求胜机制:当国家面临危机时,举国上下认为战争难以避免的情况下,该国民众希望上台的领导人是有战争经验的,这样有利于帮助国家取得战争胜利例如,二战时期,丘吉尔就是在战争一触即发时被英国民众选为首相,并在二战中成功帮助英国获胜。
如果要解决上述选择效应问题,就需要在模型上加以处理,如采用Heckman模型或者对样本进行倾向评分匹配(PSM)处理等以Heckman模型为例,其操作分为两个阶段第一个阶段对所有潜在对象进行Probit回归分析,因变量为是否进行某一选择。
例如,针对前文军事经历对冲突偏好影响的问题,可以在第一阶段考虑将所有领导人纳入样本,包括没有参军经历的,并分析其是否报名参军根据回归结果可以得出逆米尔斯比率(IMR)第二个阶段将逆米尔斯比率纳入模型例如,在军事经历对冲突偏好影响的研究中,第二阶段的核心自变量是军事经历类型,可以细化为是否参与战争、是否参与冲突、是否参与内战、参军总年数、在军队身份是基层士兵还是中高层军官等,此时模型除了增加其他控制变量还需考虑逆米尔斯比率,因变量为是否对外战争,经过上述处理后的回归结果才可以避免选择偏差。
第三,对双向因果的处理还有一个常见的内生性问题就是自变量与因变量互为因果例如,在研究中国与各国建立外交伙伴关系对中国外交效果的影响时,自变量为中国与各国的伙伴关系的建立或者升级,因变量为中国与各国的联大投票数据,其假设是:若中国与某国建立或升级伙伴关系,则双边关系改善,其结果是该国在联大投票的立场会接近于中国的立场。
然而,在对这一假设进行统计检验时,可能出现因果颠倒的问题有可能真正的作用机制是,由于该国与中国立场接近,在联大投票一致性高,导致该国与中国外交关系改善,其结果是两国建立或升级伙伴关系对于这类问题,可以采用工具变量、动态面板GMM模型等方法。
在稳健性检验之外,学界近年来在双重差分(DID)等准自然实验模型中也会进行安慰剂(Placebo Effect)检验在双重差分模型中,一般选择两组样本,一组是实验组,一组是对照组其中实验组采用了某一政策,而对照组则没有,因此实验组在该政策前后的变化减去对照组在同一时段的变化得出的差值,就可以被视为该政策的效果。
然而,此处回归结果仍然存在可被质疑之处,亦即双重差分的回归结果不一定意味着是该政策导致的因变量变动因此,安慰剂检验针对双重差分模型进行检验,通过更改政策发生的时间或者实验组,以判断若在错的政策时间或实验组也得到与之前双重差分类似的结果,则之前模型的政策效应有可能不可靠。
例如,若分析“一带一路”倡议对中国外交的影响,则可以在安慰剂检验中更改各国加入“一带一路”倡议的具体年份例如,提早到“一带一路”倡议实施前一年或前三年,然后采用双重差分模型进行逐年回归,若回归结果中核心变量系数不显著,则表明通过了安慰剂检验。
此外,还可以将一些没加入“一带一路”倡议的国家也放入实验组,若新的安慰剂检验结果与基准模型的结果一致,则说明此前双重差分基准回归中有关“一带一路”倡议的效果分析可能有误,因变量的变动有可能是其他时间段政策或因素带来的结果。
随着学科的进步,国际关系学界不应满足于对变量间关系进行简单的回归分析,还应判断该回归模型结果是否具有说服力,因此各种检验可以被采纳本文只介绍了常用的稳健性检验和安慰剂检验方法,检验方法不仅限于这两种当然,学界也要注意,过多的检验容易导致论文太过烦琐。
检验的目的是确保回归结果的可信度,不能本末倒置若对研究中自变量对因变量的作用机制疏于探究,而用大量篇幅反复就统计细节进行检验,这种做法亦不可取(作者单位:清华大学国际关系学系)作者:漆海霞来源:中国社会科学网-中国社会科学报