| English| |

分析国际危机升级的挑战

发布时间:2023-09-01 来源:国合中心

解释危机升级临界点的挑战

1. 战略不确定性

解释风险局势是否会演变为危机的第一个挑战来自于对相关行为体在战略层面的理解程度。行为体不太可能采取容易被预料到的进攻或防御行动,因为他们担心对手会部署有效的反制战略,所以说出其不意是军事战略的一个关键元素。行为体的行动具有很强的随机性,分析者很难提供有关情报来充分说明局势是否能够在不升级的情况下加以控制,或者事件是否走向暴力升级。然而,研究人员难以准确地看到行动的效果,毕竟在相同情况下,无法同时观察到行为体不同选择得到的结果。因此,未建立在正确战略互动模型上的危机升级模型很可能会错估行为体的选择对危机升级潜在的实际影响。

2. 避免低效的动机

如果危机对行为体来说成本过高,那就有和平解决争端的动机。如果一个行为体知道某个特定的可观察变量与对手可接受的范围(保留点)相关,那么行为体提出的要求将尽量落入对手的预期范围。与对手战斗意愿相关的变量会影响行为体需求的分布范围,但不会影响谈判失败的概率。因此,一些可观察的结构性变量,如与权力不对称变化相关的变量,在预测临界点的实际变化上没有什么解释力。行为体在讨价还价时会考虑到这些变量,这些变量可以帮助研究人员理解和解的条件,甚至是行为体试图重新谈判的总体动机,但这些变量还是不能很好地帮助研究人员理解行为体讨价还价的失败并在特定情况下导致危机升级的原因。

3. 案例稀缺

因为国际危机的实例太少,所以无法满足需要大量数据的归纳算法。国际危机行为(ICB)项目目前已对1918-2017年的487个国际危机的信息进行了编码,但可以用来解释危机爆发的变量组合几乎是无限的。考虑到影响冲突与和平的最重要的因果关系因时而异,寻找类似案例就相当复杂和困难。危机升级源于复杂的战略互动,而现有的理论发展水平并不能使研究人员对如何将模型参数化有足够的预期,从而较好地模拟这种复杂互动的数据生成过程。

4. 高质量数据的欠缺

通常来讲,如果研究人员的观察对象是武装行为体,那么获取其动机、能力和决心等信息就非常困难。即使研究人员对危机升级的理论理解有所改善,也不太可能发展出更好的经验模型,因为现有数据没有很好地映射到理论模型概念上。数据缺失问题很普遍。研究人员使用不完整数据或重组数据可能会产生样本选择偏差或测量偏差。此外,在收集数据的问题上,研究人员从次级来源收集准确数据往往需要更多背景知识。一手来源数据通常需要理解非英语文本,但很少有研究团队具备足够的能力或资源系统地收集大量高精度的数据。

对国际危机行为的触发建模:从定量方法开始

为了说明临界点行为模型面临的挑战,本文使用了国际危机行为项目的数据,采用了两种模型:一种是机器学习算法——随机森林模型(random forest model),一种是参数模型——分离总体持续期模型(split-population duration model)。研究人员用这两个模型来评估哪些变量可以解释月度层次上的危机升级变化。作者预期,与相对权力变化有关的结构性变量以及行动层面的变量在解释高风险案例中的危机发生方面将会表现不佳,而与保持好战政策的国内动机有关的变量应该更具解释力。由于不能确定对临界点行为的解释对当前政策相关问题是否有帮助,本文将解释力作为统计显著关联和预测准确性的函数来评估。

文章关注1995-2017年国际体系中所有的非定向、月度层次上的的国家对(dyad),排除了数据库中任何月份都没有发生危机事件的国家对。模型中的因变量是一个二分变量,用于判断某对国家在当月是否在发生对外政策危机。

1. 解释变量的测量方法

模型包含了许多解释变量。第一组变量用以衡量国家在军事能力、外交政策偏好相似性、贸易依赖性和经济绩效方面的权力相对上升和下降。第二组变量与政权巩固性(regime entrenchment)有关,定义为国家的稳定性及其拥有从内部治理、维护秩序和捍卫政权的制度能力的程度。用于衡量的变量包括政体民主-专制综合指数的水平和变化,以及政体数据的耐久性得分。研究表明,与民主治理巩固程度有关的政权巩固变量在解释临界点行为方面做得相对较好。第三组变量是行为体的国家性(stateness),定义为国内制度的中心性以及抵抗或克服国内政治压力的能力,在衡量时涵盖每个国家的国家脆弱性指数(即与各国在安全、政治、经济和社会领域的有效性和合法性相关的八个组成变量的总和)。作者还设置了一组月度层次上行动层面的变量,以引入关于合作和冲突事件的信息。作者对属于物质冲突、物质合作、口头冲突或口头合作类别的行动进行编码。其中月度统计反映了行为体在观察前的一段时间内的行为,而累积变量则更多地反映了各国在最近一段时间内相互之间合作或冲突的总体趋势。最后,为了解释每个行为体参与危机的不同倾向,作者采用了每个行为体在国际危机网络中的中心度(degree centrality),用以衡量行为体成为国际危机的目标(in-degree)或向它国发起危机行为(out-degree)的程度。

2. 定量结果

作者从随机森林模型开始,这是一种机器学习的“分类树(classification tree)”模型,擅于通过涵盖每个变量来比较增加的信息量。分类树模型将由一组变量所创建的多维空间划分为独立的区域。这些区域中的每一个都由树的一个终端节点表示。目标是让每个区域最大限度地提高属于单一类别的观察值的比例(二分结果的情况分别是危机发生或没有危机发生)。分类树从原点节点处的所有观测值开始,通过在代表解释变量值差异的两个分支之间反复划分而生成。随机森林模型建立在分类树的这一理念之上,在每次分区的变量子集之间随机选择,然后对生成的所有分类树取平均值。随机森林模型的计算量很大,因此作者将“四元”行动层面的变量汇总为合作和冲突事件。

图1展示了在预测ICB危机发生时最有解释力的变量的排序。可以看到,与前三个变量相比,所有其他变量的解释力都很差。此外,前三个变量都是衡量是否存在危机升级的许可条件的最直接指标。任何一方行为体的高度中心性以及双方冲突事件的积累,都能很好地帮助预测国际危机的发生。

1

图1: 危机发生的随机森林模型

为了进一步评估随机森林模型中变量的解释力,作者生成了一个混淆矩阵表,用于比较预测值与实际值。如表1所示,随机森林模型在避免结果的假阴性方面表现很好,但假阳性的数量要高于真阳性。可以看到,该模型在识别一组不存在危机升级风险的案例方面表现很好。然而,在风险最大的案例中,该模型对危机升级的预测效果不佳。这些结果与作者的预期一致,这些变量捕捉到了危机的许可条件但不是直接原因。

2

表1: 随机森林模型的预测值与实际值比较

研究结果表明,定量模型可以很好地理解何时存在危机的许可条件,但它们不太适合解释危机升级的直接原因。为了更清楚地了解变量在一组容易升级的案例中如何解释临界点行为,作者使用了一个分离总体持续期模型(SPDM)评估了两个模型:一个用于确定给定的观察值是否有发生危机的风险;另一个用于观察直到危机发生之前的这一段时间。SPDM的设计考虑到许多观察点不存在危机风险的可能性,从而有助于区分冲突的许可条件和直接原因。

图2显示了SPDM估计的两个方程式的结果。左边的一组系数显示了与曾经经历过危机的风险的关系,右边的系数显示了与危机发生前的时间的关系,其条件是有可能发生危机。该图显示了四种显著模式。首先,中心性变量作为危机发生风险的解释变量占主导地位,这印证了随机森林模型中观察到的模式。其次,在关注危机发生的时间方程时,政权稳固性和国家性变量往往能很好地解释危机发生的时间,条件是存在危机风险。与预期一致的是,一旦走上危机的道路,领导人所面临的避免让步的国内压力会将他们进一步推向危机升级。第三,与权力上升和下降有关的结构性变量在解释危机发生时往往表现不佳,但人均GDP和GDP比率较低的变量除外。第四,许多行动层面的变量在解释危机升级的时间方面也表现得较差,只有对手之间的实质性冲突是例外。后面两个结论与预期一致,即与国家权力动态相关的结构性变量以及行动层面的变量在解释临界点行为方面都表现不佳。

3

图2: SPDM模型的危机风险和发生率,置信度在95%区间内。

作者不仅期望政权巩固和国家性变量对处于风险的案例中的危机升级倾向具有最大的解释力,而且期望国内政治变量能够制约行动层面变量对临界点行为的影响程度。因此,作者额外运行了SPDM模型,该模型挑选了那些低政权巩固度的子集。衡量方法是,双方中的一个国家是否具有较低的政体得分,以观察其他变量如何根据所涉及的国家是相对威权还是民主而变化。

图3显示了政体得分低于零的每对月份的结果。可以看到,所有行动层面的变量在解释危机发生前的时间方面都具有统计学意义。此外,实质性影响的相对规模也很大。当政权巩固程度较低的行为体动员起来并摆出相应姿态时,它们更有可能陷入危机。因此,它们被观察到的冲突和合作行动比政权稳固程度高的国家的行动更能说明危机是否将升级。

4

图3:针对政体得分低于零的SPDM模型

定性方法的优势

定性与定量方法具有互补优势。定性方法的优势体现在三个方面。

1. 信息优势

通过历史案例研究方法,研究人员可以使用档案和论述工具识别并解释复杂变量。通过探索多个国家关键决策者的私人文件、考察内阁会议纪要或访谈危机的参与者等,研究人员能够找到超越其编码的变量,对导致特定临近危机演变为危机的因素进行更开放的分析。

2. 发现“确凿”证据

定性案例研究可以利用政府文件、私人文件收藏、回忆录,甚至对决策者的访谈发现确凿的证据,用以解释做出特定决定的确切原因。这使得研究人员不仅可以将变量与结果或假设的因果序列联系起来,而且至少可以在单个案例中证明,是什么导致了所讨论的结果。数据可以描述做出决策的环境因素,而第一手资料可以解释动机。

3. 认知的作用

定性研究可以阐明行为体如何真正理解他们所处的境遇。如果行为体基于错误认知行动,那么将因果关系的重要性归因于客观环境条件是不准确的。这也许有助于解释为什么单凭环境条件不能很好地预测危机的升级。危机和临近危机的决定因素都包括“认知(perception)”。在危机即将来临的情况下,行为体各方认为时间期限缩短,基本价值观受到威胁,但军事升级的风险没有增加。因此,探究行为体的认知能力对于确定危机动态和临界点至关重要。

4. 临界点危机案例

本文使用第三次台海危机(1995-1996)来说明定性方法对于确定临界点轨迹的重要性。定性分析显示,ICB数据集所确定的危机触发日期并不能很好地捕捉到该案例实际陷入危机的时刻。仅从事件数据来评估,ICB危机开始于1995年6月7日,结束于1996年3月。本文的案例分析则显示,这实际上并不是从接近危机到发生危机的转折点。案例分析表明,国内政治是理解危机升级的重要视角。如果分析人员只掌握危机升级定量研究中的信息或不了解领导人所面临的政治压力,就无法作出准确的危机升级预测。

总结

基于结构性变量和行动层面的变量来解释危机升级的发生是很难的。战略行为体的行动总是具有很强的随机性。背景知识对于解释特定高概率的危机是否,以及何时会升级十分重要。然而,这并不意味着行为体的决定需要被视为特殊。通过定性和定量相结合的方法,研究人员不仅关注结构性变量,而且关注与政权巩固和国家合法性相关的变量,从而能够在很大程度上解释临界点何时发生,以及为什么会出现这样或那样的趋势。

使用基于最先进的社会科学方法的案例研究方法可以极大地提高情报评估的准确性。这项研究指出了情报评估的重要性,那就是不要过于强调结构性和行动层面的变量的意义,因为这些变量难以告诉研究人员行为体将如何应对某一行动方案,同时本文也强调了与政权巩固和国家性有关的变量的重要性,这些变量能够反映领导人采取某些行动的动机。(作者:陈冲 清华大学社科学学院国际关系学系副教授;Jordan Roberts 美国卡罗莱纳海岸大学国际研究系助理教授;Shikshya Adhikari 美国纽约州立大学奥尔巴尼分校政治学系博士候选人;Victor Asal 美国纽约州立大学奥尔巴尼分校政治学系教授;Kyle Beardsley 美国杜克大学政治学系教授;Edward Gonzalez 美国南加州大学政治学与国际关系系博士候选人;Nakissa Jahanbani 美国西点军校社会科学系助理教授;Patrick James 美国南加州大学政治学与国际关系系教授;Steven E. Lobell 美国犹他大学政治学系教授;Norrin M Ripsman 美国里海大学国际关系系教授;Scott Silverstone 美国西点军校社会科学系国际关系教授;Anne van Wijk 美国南加州大学政治学与国际关系系博士候选人)