【最后通牒博弈】 — 一个揭示公平与理性的实验游戏

最后通牒博弈(Ultimatum Game)是一个在实验经济学、心理学和神经科学中广泛研究的简单非合作博弈。它虽然结构简单,却能深刻揭示人类行为中超越纯粹理性计算的复杂性,尤其是关于公平、互惠和情绪在决策中的作用。以下将围绕这一博弈,详细解答它“是什么”、“怎么玩”、“为什么”、“有多少”、“在哪里”、“如何变化”等一系列具体问题。

最后通牒博弈具体是“什么”?它的基本设定是怎样的?

最后通牒博弈是一种一次性的、两人参与的、完全信息的序贯博弈。它的基本设定可以概括为:

  • 参与者: 两人,通常标记为提议者(Player A)和回应者(Player B)。两人通常是匿名的,且只进行一次博弈。
  • 资源: 一定数量的可分割的资源,通常是一笔钱(例如 100元)。
  • 规则:

    1. 实验者设定一笔总金额(例如 100元),并告知双方。
    2. 提议者(Player A)首先行动,他必须决定如何将这笔总金额在自己和回应者(Player B)之间分配。提议者可以提出任何分配方案,例如,提议者自己留 80元,给回应者 20元;或者提议者自己留 50元,给回应者 50元;甚至提议者自己留 0元,给回应者 100元(尽管这极少见)。
    3. 提议者将其分配方案告知回应者。
    4. 回应者(Player B)接下来行动,他有两个选择:
      • 接受(Accept): 如果回应者选择接受提议者的方案,那么这笔总金额就按照提议者提出的方案进行分配。提议者得到其提议保留的金额,回应者得到其提议分配的金额。
      • 拒绝(Reject): 如果回应者选择拒绝提议者的方案,那么两人都得不到任何金额,总金额被实验者收回。
    5. 博弈结束。

请注意,这是一个“最后通牒”,因为回应者没有讨价还价的机会,只有接受或拒绝两个极端选项。拒绝意味着双方都一无所获,这使得回应者的拒绝权成为一个非常强大的工具。

在典型的实验中,最后通牒博弈通常是“如何”进行的?

一个典型的最后通牒博弈实验通常会在受控的实验室环境中进行,以确保参与者的匿名性和一次性互动。具体流程可能包括:

实验准备

  • 招募参与者: 通常是大学生或其他社区成员。参与者被告知这将是一个关于决策的实验,他们有机会赚取真实的金钱。
  • 分组: 参与者被随机分成提议者和回应者两组。
  • 隔离: 参与者通常被安排在独立的隔间里,使用电脑进行互动,以确保匿名性,防止非语言交流影响结果。
  • 说明规则: 实验者详细解释博弈规则,包括总金额、提议和回应者的角色、以及接受和拒绝的后果。通常会进行理解测试,确保所有参与者都完全理解规则。

博弈过程

  • 提议: 提议者通过电脑界面输入他们希望分配给回应者的金额(从 0 到总金额之间)。
  • 回应: 回应者通过电脑界面收到提议者的分配方案。他们必须选择“接受”或“拒绝”。
  • 结果: 电脑根据回应者的选择计算最终分配结果,并在屏幕上显示给双方。如果接受,显示各自分得的金额;如果拒绝,显示双方都得 0。

支付

  • 实验结束后,参与者根据他们在博弈中的实际所得(或 0)获得报酬。真实金钱的支付是实验的关键,它确保参与者认真对待这个博弈,并使其决策具有真实的经济后果。

纯粹理性经济理论预测的分配结果是“什么”,以及“为什么”实际结果与预测存在显著差异?

基于标准的新古典经济学假设,即所有参与者都是完全理性的、追求自身利益最大化的个体(Homo Economicus),最后通牒博弈有一个清晰的理论预测。

纯粹理性的预测

在最后通牒博弈中,如果双方都完全理性且只关心自己的金钱收益,那么:

回应者(Player B)会接受任何大于零的提议。 理由是,即使是最小的金额(例如,总金额的最小可分单位,如 100元中的 1元),也总比拒绝后得到 0元要好。接受 1元 > 拒绝 0元。

提议者(Player A)预测到回应者的理性行为后,会提议给自己留下绝大部分金额,只给回应者最小可能的金额。 理由是,提议者想要最大化自己的收益,并且知道回应者为了避免一无所获,会接受那个最小的非零提议。所以,提议者会提议给回应者 1元,自己留下 99元(假设总金额 100元且最小单位是 1元)。

这个预测是通过一种称为“逆向归纳法”(Backward Induction)的博弈论分析方法得出的:先分析博弈的最后一个阶段(回应者的决策),然后向前推导提议者的最佳策略。

实际结果与预测的差异及“为什么”

然而,大量的实验研究表明,现实世界中的人类行为与这个纯粹理性的预测存在显著差异。这是最后通牒博弈最引人入胜之处:

  • 提议者的提议: 提议者很少会提出给回应者最小金额的方案。典型的提议是总金额的 40% 到 50% 之间,50/50 的分配方案非常普遍,甚至是众数(出现频率最高的提议)。提供低于 20% 的提议相对较少。
  • 回应者的回应: 回应者经常会拒绝那些他们认为“不公平”的提议,即使这些提议的金额大于零。低于总金额 20% 或 30% 的提议通常会被回应者以很高的概率拒绝。这意味着回应者为了惩罚不公平的提议,宁愿自己一分钱都得不到。

“为什么”会出现这种差异? 这主要归因于人类行为中超越狭隘的自我利益驱动的因素,包括:

  • 公平感和公平偏好(Fairness and Fairness Preferences): 人类不仅仅关心自己的绝对收益,也关心收益的相对公平性。人们对不公平的分配感到不适,并愿意付出代价(拒绝提议)来维护公平或惩罚不公平行为。
  • 互惠性(Reciprocity): 这包括积极互惠(以善报善)和消极互惠(以牙还牙)。在最后通牒博弈中,回应者拒绝不公平提议是一种消极互惠行为,是对提议者不公平行为的惩罚。
  • 情绪(Emotions): 不公平的提议会引发回应者的负面情绪,如愤怒、厌恶或受到冒犯的感觉。这些情绪会促使他们做出非理性的决定(从纯粹金钱收益角度看是非理性的),即拒绝提议。神经科学研究也显示,在回应不公平提议时,与负面情绪相关的脑区会被激活。
  • 社会规范(Social Norms): 在许多文化中,存在关于公平分配的社会规范。参与者在博弈中会受到这些规范的影响,即使在匿名环境下也可能遵循这些规范,或者预测到对方会期望符合规范的提议。
  • 声誉或未来互动考虑(即使博弈是一次的): 尽管标准设定是单次博弈且匿名,但在某些变体或参与者潜意识中,可能会存在对声誉或未来潜在互动的微弱考虑,这也会促使更公平的行为。提议者可能担心如果提议太低会被拒绝,所以会提供一个能被接受的最低水平,而这个水平往往远高于零。

总之,最后通牒博弈是强有力地证明了人类决策不是完全由理性计算和狭隘的自我利益驱动的,公平、互惠、情绪和社会规范等因素在其中扮演着重要角色。

典型实验中提议者通常提供“多少”,以及回应者拒绝的比例大约是“多少”?

虽然具体数据会随实验设计、参与者群体和总金额等因素有所变化,但大量研究已经得出了相当一致的典型结果:

提议者的提议金额:

  • 平均提议: 提议者平均会提议分配总金额的 30% 到 50% 给回应者。
  • 众数提议: 最常出现的提议金额是总金额的 50/50 分配。
  • 低提议的发生率: 提议低于总金额 20% 的情况相对较少发生。

回应者的拒绝率:

  • 低提议的拒绝: 对于那些被认为是“不公平”的提议(例如,低于总金额 20% 或 30% 的提议),回应者有很高的概率会选择拒绝。这个概率可能高达 40%-60% 甚至更高。
  • 高提议的接受: 提议金额达到或超过总金额 40% 的方案通常会以非常高的概率(接近 100%)被接受。
  • 临界点: 存在一个模糊的“拒绝阈值”,通常在总金额的 20% 到 30% 之间。低于这个阈值的提议被拒绝的可能性急剧增加。

这些数据是最后通牒博弈研究的核心发现,它们直接挑战了纯粹理性的预测,并为研究公平、互惠等社会偏好提供了量化依据。提议者之所以提供相对公平的方案,很大程度上是因为他们预测到不公平的方案会被拒绝,从而导致自己也一无所获(即他们考虑了回应者的“理性”——在这种情况下,“理性”包括了对不公平的规避或惩罚)。

“为什么”回应者会拒绝一个明明可以获得一些收益(大于零)的提议,宁愿什么都得不到?

这是最后通牒博弈中最违反纯粹经济理性假设、也最令人着迷的发现。解释回应者拒绝“不公平但非零”提议的行为是理解人类社会偏好的关键:

  • 惩罚不公平(Punishing Unfairness): 回应者将提议者的低报价视为一种冒犯或剥削。拒绝提议是一种惩罚提议者不公平行为的方式。即使这种惩罚需要自己付出代价(失去可能获得的金额),回应者也愿意这样做,因为惩罚的满足感或维护公平原则的价值可能超过了获得的金钱。
  • 表达不满和信号传递(Expressing Dissatisfaction and Signaling): 拒绝也是回应者向提议者(以及可能的观察者)传递一个信号:这种不公平的行为是不可接受的。即使是单次博弈,这种信号传递也可能源于更广泛的社会互动经验。
  • 避免被视为软弱或可欺(Avoiding Being Seen as Weak or Exploitable): 如果一个回应者总是接受非常低的提议,他可能被视为容易被剥削。拒绝低提议可以建立一种“不好惹”的形象,尽管在单次匿名博弈中这似乎不重要,但这可能是人类长期社会互动中形成的倾向。
  • 情绪反应(Emotional Reaction): 就像前面提到的,不公平的提议会引发负面情绪。这些强烈的情绪反应可以压倒对金钱收益的理性计算,促使回应者做出情绪驱动的决定。
  • 对自身价值的感知(Perception of Self-Worth): 回应者可能觉得,接受一个极低的提议是对自身价值的贬低。为了维护自尊,他们选择拒绝。

这些解释表明,人类在做决策时,考虑的不仅仅是金钱收益,还包括社会因素、情绪状态以及对公平和互惠的感知。拒绝行为本身就是一种行为,它带来了“惩罚不公平”或“维护公平感”的效用,这种非金钱效用在回应者的决策中可能权重非常高。

“多少”金额或“什么”样的比例会被认为是不公平的,这个标准会受到哪些因素的影响?

被视为不公平的“门槛”并非固定不变,它会受到多种因素的影响:

  • 总金额的大小(Size of the Stake): 研究发现,当总金额非常大时,回应者可能会更倾向于接受一个比例上看起来不那么公平(比如低于 20%)但绝对金额仍然可观的提议。换句话说,绝对收益的吸引力可能会在一定程度上削弱对公平的要求,但极低的绝对金额提议即使总额很高也容易被拒绝。
  • 文化背景(Cultural Background): 这是影响最后通牒博弈结果最重要的因素之一。由 Henrich 等人在世界各地不同小型社会进行的一项开创性研究发现,不同文化背景下的提议和拒绝模式差异巨大。在一些市场整合度较高的社会,提议接近 50/50 更普遍;而在一些礼物交换传统更强的社会,甚至会出现提议者提议超过 50% 的情况;而在一些小型社会,人们的提议非常接近零,回应者也较少拒绝,因为他们可能缺乏惩罚陌生人的社会规范。这强有力地证明了社会和文化规范对经济决策的塑造作用。
  • 参与者的关系或背景(Relationship or Background of Participants): 如果参与者之间存在某种关系(非完全匿名)或者他们知道对方的某些背景信息(例如是需要钱的学生 vs. 富有的商人),这可能会影响对公平的判断和提议策略。
  • 博弈的框架(Framing of the Game): 如果博弈被包装成不同的情境(例如,这是分配利润 vs. 这是分享意外之财 vs. 这是惩罚任务失败者),结果可能会有所不同。
  • 重复博弈(Repeated Games): 如果参与者知道他们将进行多轮博弈,并且可能记住之前的互动对象,那么提议者可能会更倾向于公平以建立好的声誉,回应者也可能利用拒绝来“教育”对方。然而,标准的最后通牒博弈是单次的。
  • 信息不对称(Information Asymmetry): 如果回应者不知道总金额是多少,提议者可能会提供较低的金额,而回应者由于不确定公平的标准,可能会接受较低的提议。
  • 引入第三方惩罚(Third-Party Punishment): 在一些变体中,引入一个不参与分配的第三方,观察到不公平提议时,第三方可以选择付出成本来惩罚提议者。这表明旁观者也具有强烈的公平偏好。

因此,“不公平”是一个相对概念,其界定很大程度上依赖于社会文化背景、博弈的具体情境以及参与者的个人偏好和预期。

最后通牒博弈“在哪里”被研究?它在实验室外有哪些潜在的应用或体现?

最后通牒博弈是一个典型的行为经济学实验工具,其研究主要集中在:

  • 学术实验室: 这是最主要的研究场所。经济学、心理学、神经科学、人类学等领域的学者在大学和研究机构的实验室中设计并执行标准或变体形式的最后通牒博弈,收集参与者的行为数据。
  • 田野实验: 为了考察文化因素的影响,研究者也在世界各地的不同社区(包括许多小型、非工业化社会)进行田野实验,观察当地居民在最后通牒博弈中的表现。
  • 在线平台: 随着技术发展,研究者也开始在网上招募参与者进行最后通牒博弈实验,以便更容易接触到多样化的群体并收集大量数据。

最后通牒博弈的发现揭示了人类决策中的一些基本原则,这些原则在实验室之外的许多现实情境中都有体现或潜在的应用:

  • 谈判和议价: 在商业谈判、劳资谈判、国际关系谈判中,一方提出的方案不仅仅取决于自身利益最大化,还需要考虑对方的“可接受程度”和对公平的感知。一个被认为极不公平的提议很可能导致谈判破裂(相当于拒绝提议),即使接受对另一方有利。
  • 法律和司法: 法律诉讼中的和解谈判、损害赔偿的判定等都涉及双方对“公平”结果的预期和判断。一方可能会拒绝一个金额较高但他们认为不足以弥补损失或惩罚过错方的和解方案。
  • 定价策略: 企业在制定产品价格时,除了考虑成本和市场需求,还需要考虑消费者对价格“公平性”的感知。过高的利润率可能被视为不公平,导致消费者拒绝购买或产生抵制。
  • 资源分配和公共政策: 政府在制定税收政策、福利分配、环境保护政策时,需要考虑公众对这些政策公平性的反应。一个被视为极度不公平的政策可能导致社会不满、抗议甚至不合作行为。
  • 演化生物学: 最后通牒博弈的结果为理解人类合作行为的演化提供了视角。公平偏好和惩罚不公平的意愿可能是在人类社会协作中演化出来的机制,有助于维护社会秩序和促进合作。

因此,虽然是一个简单的实验游戏,最后通牒博弈的原理和发现却能在广泛的社会和经济互动中找到影子。

最后通牒博弈有哪些常见的“变化”或扩展形式,它们揭示了什么?

为了更深入地理解影响人类决策的因素,研究者开发了最后通牒博弈的多种变体:

  • 独裁者博弈(Dictator Game): 这是最后通牒博弈最直接的对比。规则与最后通牒博弈类似,但移除了回应者的拒绝权。提议者(独裁者)决定如何分配总金额,回应者只能被动接受。

    • 揭示: 在独裁者博弈中,提议者分配给回应者的金额通常比最后通牒博弈中要少得多,很多提议者选择自己留下全部或绝大部分金额(尽管给零的情况也少于完全理性的预测)。这表明,在最后通牒博弈中,提议者之所以提供相对公平的方案,很大程度上是出于对被拒绝的恐惧(战略性行为),而不是纯粹的利他或公平偏好。但独裁者博弈中非零的分配也表明,即使没有被拒绝的威胁,部分人仍然有一定的公平偏好或利他倾向。
  • 序列最后通牒博弈(Sequential Ultimatum Game): 在这个变体中,提议者和回应者的角色可能会在多轮博弈中互换,或者他们记住之前的互动。

    • 揭示: 重复博弈或角色互换可以影响策略的演化,有时会导致提议者提供更公平的方案,有时也可能导致回应者在早期拒绝以建立强硬的声誉。
  • 竞争性最后通牒博弈(Competitive Ultimatum Game): 可能有一个提议者和多个回应者,或者多个提议者竞争向一个回应者提出分配方案。

    • 揭示: 引入竞争元素会改变博弈的动态。例如,多个提议者竞争时,他们可能会被迫提出更慷慨的方案以确保被接受;多个回应者时,他们接受低提议的可能性可能增加,因为他们担心别人会接受而自己一无所获。
  • 有第三方惩罚的博弈(Ultimatum Game with Third-Party Punishment): 引入一个不参与分配但可以花费自己的点数来惩罚提议者的观察者。

    • 揭示: 即使是与自己利益无关的第三方,也愿意付出成本来惩罚他们认为不公平的行为,这进一步证明了人类强烈的公平偏好和惩罚不公平的倾向。
  • 需求博弈(Demand Game): 双方同时提出自己想要的金额,如果总和不超过总金额,则按需求分配;如果超过,则双方都得零。这与最后通牒博弈的序贯性不同。

    • 揭示: 这种同时行动的博弈结果通常高度依赖于参与者的预期,可能导致僵持和双方都得零的情况。

这些变体通过改变博弈的关键参数,帮助研究者分离和识别影响决策的不同因素,例如战略考虑(对被拒绝的恐惧)与非战略性的社会偏好(纯粹的公平感、利他)。

总结

最后通牒博弈是一个简单而强大的实验工具,它通过一个直接的分配任务,清晰地展示了人类行为如何偏离纯粹理性经济模型的预测。提议者愿意提供显著高于零的金额,回应者愿意拒绝能带来收益但被视为不公平的提议,这些行为共同揭示了公平、互惠、情绪和社会规范在人类决策中的核心作用。通过研究最后通牒博弈及其变体,科学家们对人类的社会偏好有了更深的理解,这对于理解和预测现实世界中的谈判、合作、市场行为以及社会互动具有重要意义。


最后通牒博弈

By admin

发表回复