逃离有限理性“囚笼”：经济学的困境与行为经济学的解构

2012-04-09 14:10阅读：

http://blog.sina.cn/dpool/blog/u/1402867334

经济学大逃亡研究系列3

逃离有限理性“囚笼”：经济学的困境与行为经济学的解构 [①]

冯燮刚

从上个世纪50年代以来，行为经济学在心理现实化和描述性转向上取得了令人瞩目的成就。怀着规范性理想，正统经济学家以预先得到完备界定的心理偏好为其逻辑前提和根本依据，建构了以完全理性的自我为中心的、封闭的、单极化本质主义的选择行为理论范式（李子奈，冯燮刚，2005)。面对正统经济学选择行为理论与行为现实的系统偏差，行为经济学致力于正统经济学心理基础的现实化，有限理性的自我逐渐取代完全理性的自我成为选择行为理论的微观心理基础（冯燮刚，李子奈，2005年第10期）。在心理现实化的过程中，行为经济学逐渐放弃了建立封闭的、绝对的规范性理论体系的努力，转向了更加富于弹性的描述性。行为经济学在心理现实化和描述性转向上取得的丰硕成果，迫使经济学家不得不更多地关注行为的背景、社会现实等因素，偏好的学习机制、演化机制和随机过程已经逐渐被纳入行为研究的中心领域，正统经济学的理论前提——预先得到完备界定的偏好关系在行为过程中被显现——遭到致命的质疑和系统的解构（冯燮刚，李子奈，2006年第4期）。在完成描述性转向后，在最近十多年里，行为经济学大大拓展了经济学的研究领域，开始系统研究决策者在参与者多边互动过程中的选择行为，情感因素、社会效用等被正统经济学忽略的领域得到越来越多的重视，行为经济学与博弈论正在综合形成的行为博弈论加速了决策者融入人文关系世界的进度，对决策者的决策行为研究也逐渐深入到了未知世界。在最近几年，综合各个领域研究成果的新的理论框架已经开始形成。而在行为经济学的拓展和综合过程中，经济学更深层次的问题——单极化本质主义的结构化陷阱——逐渐浮现出来。正是在单极化本质主义的框架之下，经济学在经过三百多年的发展后，重新回归近两千五百

年前的柏拉图。这是经济学发展面临的巨大困境。但是，希望总是与困境相随。在困境之中，经济学加快摆脱先入为主的、封闭的单极化本质主义框架，更加光明的前途正在向未来和现实展开。

第1节大脑理性无法应对的弈局：行为博弈

在正统经济学中，博弈论为描述参与者之间的策略互动行为提供了数学工具，并将参与者之间相互影响的选择行为形式化。正统经济学的博弈分析对参与者的策略理性做了以下假设：一、策略思维假设。参与者基于对其他人的行为的分析形成判断；二、最优化假设。参与者基于这些判断选择最佳的行为策略。三、博弈均衡假设。参与者持续调整他们的判断和行为策略，直到达到相互一致（Camerer, Ho and Chong, 2004）。在互动的策略行为过程中，策略理性被形式化为迭代式的策略思维过程：甲通过算计乙会如何算计甲的选择来算计乙的选择，并决定自己的行为策略；乙同样如此。作为迭代思维的自然结果，博弈者达到相互一致的行为策略——博弈均衡。
策略理性的结果与现实行为的差异很快随着行为经济学家对该领域的关注而被发现。下述选美博弈(引自 Camerer, 2003）[②]打破了博弈论的理论预测：在博弈过程中，参与者仅仅算计有限的步数，并不是算计无限步直到博弈均衡。
选美博弈的游戏规则为：参与者同时在[0，100]选择一个数。谁的数最接近所有参与者的平均数的2/3，谁将赢得某一固定数额的奖金。根据博弈论，该博弈的那什均衡为零，在游戏参与者经过无限次的思维算计以后可以得到。但是实验表明，被选择的平均数通常在25-40，标准差20左右。大部分参与者似乎仅仅使用了一步或两步的迭代推理：相信其他人随机选数的参与者（1步迭代思维）选择了33，相信其他人都算计一步的参与者（2步迭代思维）选择了22。
对上述一次性博弈的参与者行为，行为经济学家建构了思维的认知层次模型（Camerer, Ho and Chong, 2004）。在该模型中，根据思维步骤，将参与者分成不同的认知层次[③]。基于该模型的统计分析表明，参与者的策略思维步骤是有限的，大致服从泊松分布，思维步骤一般为1-2步左右（泊松分布的均值约为1.5）。认知层次模型研究表明，参与者的策略理性是有限的，不可能进行无限的迭代思维。从心理学上看，博弈参与者具有有限的思维步骤是更加现实的。在迭代思维中，“如果她认为他预料她会做什么，那么她应该做什么呢？”是一个“递归嵌套”的问题，即使忽略对别人理性程度的判断总是受到限制的因素，对这种问题的思考，也会使大脑疲于应付。
在具有信息反馈、多次重复的选美博弈中，当重复十次时，大多数被试选择的数接近均衡值0（Camerer, Ho and Chong, 2004）。行为策略随着时间发生变化，这促使行为经济学家转向对学习机制的研究。他们引入多种学习机制来解释有限策略思维情况下，行为策略如何随着时间而调整，最终达到博弈均衡。比如信仰学习(Cheung and Friedman, 1997)，人们基于他人行为历史形成关于他人如何行为的判断，并以此来决定自己的行为策略；再如强化学习（Erev, Roth, 1998），人们从实际选择的行为策略的结果当中学习，不断强化形成行为策略。Camerer and Ho (1998, 1999)，Camerer, Ho and Chong(2004)则在信仰学习和强化学习基础上，增加了想象学习机制，建构了EWA学习机制——经验加权吸引子学习模型：人们不仅看中他人和自己的行为历史，还通过想象被放弃的选择学习。EWA学习机制具有与Kahneman(2003)综合形成的双系统模型（见后文）相似的特点：强化学习具有快、自动、有时候是潜意识的（类似于我们的感觉系统）特点，行为策略迅速地、本能似地形成；而在信仰学习机制中，参与者在想象中学习，从别人的经验、放弃的选择的审慎考虑中形成行为策略，比较慢，需要有意识地深思熟虑，通常要借助抽象的规则。在Camerer, Ho and Chong（2004)对EWA学习模型的实验研究表明，随着时间、地点不同，强化学习机制、信仰学习机制对行为策略选择的影响程度发生变化。这样，学习机制并不存在行为经济学家所希望看到的一致性，它本身也是在一定的背景下，特定的过程中被塑造，随着时间和空间背景变化而变化。
当参与者意识到博弈对手也在学习时，学习机制将变得更加复杂。前面提到的学习机制都是适应性的、回顾式的，而复杂的参与者则是前瞻性的，他们具有战略远见，他们知道博弈对手在学习，能够预料对手的行为策略如何变化。因此，他们将采取策略引导(Camerer et al., 2002a)：选择当前的行为策略，引导其对手学习，使其在将来采取对他们有利的行为策略。这种复杂的博弈过程，在商业银行贷款业务中可以经常见到，借款人知道银行评估客户信用对客户借款历史数据的依赖，因此通过小借小还建立信用记录，引导银行对其做出积极的信用评价，从而建立信用，为大借不还创造条件。
总的来看，在考虑学习机制后，在复杂参与者之间的策略互动过程中，参与者相互引导，局中有局，博弈过程异常复杂，对博弈论的现实基础则提出了更深刻的挑战：在参与者的相互引导和学习过程中，弈局本身进入了持续演进的过程，并不存在标准经济分析中的重复博弈，当然也不存在标准经济分析中的博弈均衡。在持续演进、非重复性的博弈过程中，参与者之间的互动关系逐渐取代了任何单一参与者的理性计算，成为行为分析的基础和目的。

第2节裁缝为谁缝衣：永无休止的社会效用和个人效用之争

在正统经济学中，经济人追求主观效用最大化，被认为是利己主义的典范。但行为经济学家在决策者的利己动机之外，更加关注决策者在决定自己的行为时，如何考虑他人的行为对自己的影响和自己的行为对他人的影响——社会效用。
在下述囚徒困境的博弈中，参与者如果合作将达到整体最优，但从自利角度都会选择不合作，博弈均衡是（背叛，背叛）。
表2 囚徒困境

策略回报		囚徒B
策略回报		背叛	合作
囚徒A	背叛	-8, -8	0,-10
囚徒A	合作	-10,0	-1,-1

许多试验表明，在一次性的囚徒困境博弈中，在大约一半的博弈中，参与者采取了合作策略。合作的参与者通常说，他们期望其他人也会合作，这与合作是互惠的说法是一致的，而不仅仅是利他或某些道德准则使然。这种合作行为承载的不仅是期望，而且是一种信任。Coleman(1990; 引自 Zinn, 2004)引进了理性信任的概念，信任被作为理性计算的结果而引入。“在知识无能的地方，信任便开始了”（Lewis/Weigert, 1985; 引自 Zinn, 2004）。由于信息不完全、有限理性、时间有限等限制，决策者无法进行充分的学习或交流，信任成为决策者解决现实问题的重要行为策略。在决策者和其交易对手之间，必然有某种默契或潜在的交易规则，破坏潜规则的行为将削弱直至废除这种信任关系。在囚徒困境中，研究表明，只要参与者拥有对不合作的参与者惩罚的机会，或者参与者之间有沟通的机会，合作就会增加。在合作与冲突并存的现实环境中，信任关系的选择性（选择可信任者）和惩罚性（惩罚违背潜规则的不可信任者）发挥的作用至关重要，人类的合作行为高度依赖于彼此间的信任关系，尽管这种信任关系总在持续地发生变动。
而在下述终极交易（Camerer, 2003）中，我们看到了决策者对交易公平性的关注。
甲乙两个被试被告知，甲被授权就某一笔财富在两者之间进行分配，甲向乙提议一个一次性的分配比例；乙如果接受，甲乙就按分配比例各自获得相应财产，如果拒绝两人都一无所有。
如果甲乙都是自利的理性决策者，甲将把分配比例控制得尽可能小，而乙将接受只要不是零的分配方案。但实验表明，平均的分配比例是30-50%，分配比例低于20%的提议有一半被拒绝了。乙拒绝甲的提议显示了对不公平分配行为的报复动机。
当在终极交易中引入竞争时，交易对手之间的互动关系则进一步发生显著变化。设想有两个提议者向乙提出分配方案，乙接收分配比例最高的提议。由于竞争的引入，提议者把所有财富都分配给乙是博弈均衡。实验表明，竞争导致非常不公平的分配——提议者几乎一无所获（Camerer, 2003））。
在上述参与者之间的互动行为过程中，涉及了利他主义、公平、信任、报复、仇恨、互惠和敌意等社会动机。这些偏离自利假设的经济现实受到行为经济学家越来越多的注意。他们着手建立了多种社会偏好的模型。比如差距厌恶模型 (Bolton and Ockenfels ，2000；Fehr and Schmidt，1999），假设人们有减少他们与其他人的回报差距以求公平的动机；社会福利模型(Andreoni and Miller ，1998），假设人们喜欢增加社会剩余，帮助低收入阶层，这通常会导致帕雷托改善；互易模型 (Rabin，1993），假设决策者根据交易对手行为的公平性，决定是提高还是降低其他人的回报，这经常导致破坏帕雷托效率的行为。Gary and Rabin(2002) 的实验证明，相对差距厌恶而言，人们更加关心增加社会福利——做出牺牲以提高所有人的回报，特别是低收入者的回报；人们通常也会表现出互易性：如果其他人不愿意作出牺牲，他们也会不愿牺牲以追求公平的结果，甚至惩罚不公平的行为。
我们借用终极交易的案例来总结一下正统经济学家和行为经济学家在人性假设上的分歧。当甲被试意识到乙被试可以将100$在他们二人之间按照（$50，$50）进行分配时，他将拒绝（$92，$8）的提议，尽管这将意味着他们均将因此一无所获，即都得到（$0,$0）。在行为经济学家看来，这种行为表明决策者的选择并不总是遵循自利的原则，否则他们就会接受尽管不公平，但却比一无所获要好的分配。人在这种现实问题中表现出对公平的偏好，当公平性遭到破坏时，他将采取非自利的报复行为，对对方进行惩罚。这种非自利的报复行为无法被自利原则所涵盖。但同样的问题，正统经济学家却可以给出不同的解释，决策者在这种博弈中牺牲8$得到0$的行为并不是牺牲行为，而是比较复杂的、自利的名誉建立行为，如果没有这种局部牺牲，他将被认为是软弱可欺的，由此在后续的其他博弈中蒙受更大的损失。这样，在正统经济学家看来，报复行为才是实现效用最大化的自利行为。由此，正统经济学和行为经济学在社会效用问题上产生了分歧。在正统经济分析中，裁缝为了给自己带来更多的财富而缝制衣服；而在行为经济分析中，裁缝为了让人们生活得更好而缝制衣服。但是他们的分歧并不是实质性的，在两种情况下，裁缝都是出于自己的某种偏好，在两种行为背后都有一颗评价、估计行为的心，而社会效用和个人效用就好像这颗心的不同侧面[④]。只要我们的分析要以这颗心为前提，正统经济学和行为经济学在行为动机方面的分歧就不会消除，一如正统经济学在这个问题上至今无解的争论。

第3节无限可能的明天

从决策理论的发展来看，正统经济学最先提出并系统建构的效用理论适用于决定性世界（特定行为指向唯一的特定结果）；其后，正统经济学放松了对行为结果的决定性要求，建立了适用于确定随机世界（结果集和概率分布都确定）的预期效用理论；随后进一步放松了对概率分布确定性的要求，建立了适用于模糊随机世界（结果集已知，但概率分布不确定）的主观预期效用理论（冯燮刚，李子奈，2005年第10期）。但在无法确定结果集的未知世界，正统经济学尚没有形成系统的决策理论。在二十世纪后半叶的大部分时间里，行为经济学主要局限于正统经济学的框架之内，追求心理现实化的目标，对相应世界决策理论进行修正和完善[⑤]。但随着行为经济学逐渐完成描述性转向，行为经济学家对决策理论的研究逐渐深入到未知世界。
Gilboa and Schmeidler（1995）指出，在大多数情况下，与选择对应的事件的结果很难通过直觉的方式予以界定，世界状态空间也很难予以界定。如果结果集无法确定，就无从谈起结果是否按照决定性的方式被决定，或是按何种概率分布了。因此，在未知世界，预期效用理论或者主观预期效用理论无法对选择主体的决策行为予以说明。为解决未知世界的选择问题，Gilboa, Schmeidler（1995）假设，选择主体基于他们过去处理相似问题的经验，将当前情形与过去的相似情形进行类比，从而做出选择。他们建立了下述相似效用函数。
U(a)= U_p,M(a)=
其中，（q, a, r）用问题q、行动a、结果r三个维度来表示记忆M中的情形，当选择主体遇到新问题p时，上式用以描述基于案例的决策过程：选择主体将各种可能的行动a放入记忆中与之相应的情形集M，并找到各种情形对应的结果r，将这些结果的效用u(r)按照当前情形与记忆情形集的相似程度S(p,q)进行加权，被选择的行动乃是实现相似加权效用U _p,M(a)最大化的选择。
Gilboa, Schmeidler指出，尽管相似加权效用函数与预期效用函数有相似之处，但二者在选择机制上是完全不同的：一、作为决策权重的S(p,q)没有相加起来等于1或某个固定值的限制，而预期效用函数则限定为1。二、评价行动a的标准不同。在相似效用理论中，不同的行动，将对应不同的情形集。而在预期效用理论中，所有的行动都会在同一个状态空间当中进行评价。三、评价过程不同。在相似效用理论中，基于已经发生过的情形进行评价，无需假设。而在预期效用理论中，基于所有可能的结果集的完整集合进行评价，需要假设各个行动在各种状态下的结果才能完成评价。四、信息结构不同。在相似效用理论中，除了历史情形，选择主体别无所知，他不需要区分确定性与不确定性，他只是基于特殊情形中的特殊行动进行评价。而在预期效用理论中，选择主体必须被假设面对的是完全确定的世界，必须对可能的状态空间有完全的知识，且必须引入每一个状态的先验概率，并被假定进行概率加权效用评价。五、动态结构不同。预期效用理论按照贝叶斯法则来结构化新信息，新信息被视为某个状态子集上的事件，选择主体根据新发生事件来修正主观概率。而对于相似效用理论而言，新信息被视作历史情形不断纳入记忆中的情形集。遵循预期效用理论的主体基于没有发生的状态空间而学习，而遵循相似效用理论的主体则基于对发生的事件的观察而学习。
Gilboa, Schmeidler （1995）进一步指出，相似效用理论既不是比预期效用理论更好的理论，也不是其替代理论，而是互补理论。在未知世界中，仅仅依靠类比法则进行推理的相似效用理论，可以比预期效用理论少用更多的假设推理，因为后者不仅需要假设各种情形，而且需要假设各种情形的概率分布，以及基于概率法则的数学演绎。
注意，对相似效用理论，一个非常难于回答的问题是初始化问题，即在决策者具备相似性的历史情形集为空时，如何进行选择？人们总会面临全新的问题，与新问题对应的历史情形集为空的情况并不少见。对这个问题的回答，只能在行为经济学家建构的启发机制（见后文）寻找答案[⑥]。
事实上，在高度未知、高度不确定性的世界里，在向未来世界、现实世界展开的过程中，我们要面对的，永远是我们没有处理过的，过去的都已经成为历史，未来的任何变数都有可能。比如一个红绿白三色球箱，里面一共300个，每样100个，随机抽取一个，在数学上，抽到红绿白的概率都是33.3%。这是不是不确定性？这不是！至少不是人类在现实世界中必须面对的不确定性。在现实中，我们面对的是向未来和现实展开的未知世界，就像黑洞，不知道黑洞里有多少种颜色的球，也不知道黑洞里有多少球，甚至不知道是不是都是球，尽管过去我们拿出了很多球，而且红绿白各1/3，但这仅仅是历史事件的发生频率。下一个球是什么？我们不知道！这才是真正的不确定性。
在这样的世界中，人类行为更大程度上是序贯的、一次性的。一次性或者非重复性意味着概率法则或类比法则不可能是主导我们行为规律的法则。而序贯性则表明在向未来和现实展开的过程中，人类在各个时点上的行为必然有关联性，我们必须在历史的基础上走向未来。面对这样的世界和行为现实，无视现实世界中决策者之间、决策者和环境之间持续互动的动力学过程，却试图依靠以主体为中心的选择和判断心理法则得到一致的说明，无论是规范性，还是描述性，都是不可能完成的任务。

第4节飘忽不定的情感

在有记录的关于人类智识的研究历史中，学者们对情感的研究讨论一直非常活跃。将激情当作理性试图驾驭、但却常常冲破理性约束的消极力量，一直是主流观点[⑦]。从古希腊以来，学者们一直持有这样的见解，思想、理性、远见和决策等是人类智慧的高级形式，会被情感的肆虐所破坏。因此，几千年以来，不能依靠自身理性驾驭情感的行为都被认为是野蛮或者愚昧。在主流学者的观点里，非理性的情感从来不会遵循一致的理性法则，在作为理性成就的人类知识的基本框架下，人类不会也不能对情感因素进行系统研究[⑧]。因此，在关于人类理性行为的研究中，情感因素不得不被排除在外。但在最近十年里，决策研究者对情感因素的研究兴趣明显加强。情感因素得到了越来越多的积极评价，将情感视作积极力量的观点，已经成为与传统观点并存的一个重要观点（Loewenstein, Lerner, 2003）。
在经济学的发展历程中，对情感因素的处理经历了几起几落。亚当.斯密（2000）建构了利己心驱动的经济人，将对美好主观感受的追求作为理性行为的基本目标和动力。而边沁则明确界定了以快乐和痛苦两相对立的情感为核心的效用概念，并雄心勃勃地尝试建立快乐和痛苦的客观度量，并将痛苦和快乐作为指引和决定人类所作所为的主人。但随着度量快乐和痛苦尝试的失败，经济学家放弃了基数效用理论，转向了序数效用理论。在古典经济学、新古典经济学的综合中，虽然序数效用保留了主观感受的基本内涵，但选择集上主观效用的序数性质，将经济学家对主观感受的关注，转向了对选择集中各种选择的偏好排序。怀着把经济学建构为物理学似的科学体系的经验主义理想，经济学家把各种选择引起的客观结果作为选择偏好排序的主要依据，而忽略了决定偏好顺序的情感因素。在新古典经济学综合形成的理性决策模型中，决策乃是基于完备的选择集，确定最优选择的理性计算过程。行为经济学对新古典经济学范式进行了长达半个多世纪的系统反动，作为其心理现实化努力（Camerer, Loewenstein, 2003）的结果，正统经济学的完全理性被弱化为有限理性。在行为经济学的有限理性决策模型中，决策乃是对行为选择产生的结果进行评估的认知过程。由于受到有限理性的制约，决策者的认知是可错的。在两种理论中，决策者都被假定为不动感情、冷静地计算或认知。这样，正统经济学以及行为经济学的主要研究，都采用了认识论的基本范式，决策者的情感被忽略掉了（Loewenstein etc., 2001）。
过去十多年来，行为经济学和心理学对情感的研究揭示了情感反应更为丰富的特性，那种认为情感是理性思维和适应性行为的破坏性力量的见解已经被证明是过于简单化了（Bertson, Boysen, Cacioppo, 1993; 引自 Cacioppo, Gardner, 1999）。人们越来越深刻地认识到，情感远远不仅仅是原始反射，情感在人类的实践活动中发挥了建设性作用（Cacioppo, Gardner, 1999）。越来越多的研究集中揭示了情感反应的相对性。Kahneman, Fredrickson, etc.(1993)在有关研究中发现，人们将更加偏好持续时间延长而强度衰减的痛苦情形。在进一步的研究中，Kahneman(1998)提出了一种假设：一个复杂事件的情感表示是该事件峰值体验和终值体验的函数。Schwarz and Strack(1998)发现，客观生活环境仅仅能够解释不超过10%的主观福利变化，同样一件事是提高还是降低主观福利判断，取决于是将该事件作为标准还是仅仅是生活中的一个普通的故事。比如，Medvec, Madey, Gilovich(1995)发现，由于奥运会铜牌获得者一般没有赢得金牌的期望，反而比银牌获得者（通常是冲金的热门人选）更加快乐，尽管以客观标准来看，奥运会银牌比铜牌更有价值。Carver, Scheier(1990)，Hsee, Salovey, etc.（1994）则发现，趋向或远离最终状态的速度是相应情感的重要决定因素。行为经济学家在心理现实化过程中，将价值载体从财富的绝对水平修正为财富变化量（Markowitz, 1952; Kahneman and Tversky, 1979），损失和收益获得了相对性，与之对应的痛苦和快乐丧失了绝对性。总的来看，就情感反应而言，特定事件所处的背景与特定事件本身同等重要。
这样，痛苦和快乐获得了相对性。人处于多维的行为空间中，哪个维度的状态发生变化，就会引起行为、情感、思维等在相应维度上的变化。行为经济学家对情感因素的研究，是在描述性转向上的一个拓展。尽管这种研究还刚刚开始，但已经比较系统地解释了情感反应的相对性。痛苦和快乐本身不是绝对的，它不过是特定背景、特定过程结构化的产物。正如柏拉图（2002）指出的那样，“快乐和痛苦在心灵中的产生都是一种运动……快乐就是痛苦的停止，痛苦就是快乐的停止”。既不存在绝对的主观感受，比如我们长期以来一直试图绝对化的痛苦和快乐；也不存在可以被绝对化的、中立的的客观刺激，比如经济学体系中被假设为中性的货币或时间。我们只能在特定主体和特定对象之间，在特定历史背景和空间背景之下，给出多个维度的关系刻画。
行为经济学对情感反应相对性的研究，揭示了情感的背景依赖和指向对象的基本特点。比如某某对邻居可能当选总统的嫉妒，导致对其邻居的恶言中伤，恶言中伤是在其邻居可能当选总统的背景下指向其邻居的行为。在单极化的本质主义框架下，观察、判断、选择着的心灵是人类行为的终极依据。而对情感等所谓非理性力量（嫉妒）引发的行为（对邻居的恶言中伤）而言，行为的背景和行为对象的属性（邻居当选总统的可能）成为这种行为（恶言中伤）不可忽略的重要原因，但却很难归于决策者的心理属性。因此，在以选择主体为中心的单极化本质主义框架下，具有强烈的对象指向和背景依赖性的情感，无法单极化地被选择主体的属性决定，由其导致的行为也无法在单极化本质主义框架下获得一致性，而被归于所谓的非理性力量，被排除在追求自然科学理想的经济学研究范畴之外。但是一旦从关系论（李子奈，冯燮刚，2005；冯燮刚，200410，2005）的视角看，嫉妒以及嫉妒之下的恶言中伤，乃是由邻居当选总统的可能和嫉妒者的属性共同决定，这种情绪及行为获得了在单极化本质主义框架下所不具备的一致性，可以见容于关系论的理性框架。
对经济学者而言，另一个值得深思的问题是，虽然我们无法否认情感因素对人类行为的影响，但是由于情感变化的内在性、私人性，我们究竟应该关心引起情感变化的事件，还是事件引发的情感，还是情感对行为的影响？从关系论的角度来看，情感在特定背景下，在相互关联的参与者之间被决定，是特定初始背景和参与者行为之间的中间变量，经验地确定特定初始背景和参与者行为的关系并不依赖于情感的确定。实际上往往是反过来，我们观察到参与者的行为，将其归类于某种情感；我们看到某种特定背景，由其与特定行为的关联关系和特定行为的情感归类，预期参与者的情感反应。因此，在可以按照公度性原则（李子奈，冯燮刚，2005）界定的情感因素之外，在经济分析中引入对不可观察的主观情感的直接分析，既无确实的可能，也非行为分析所必要。

第5节描述性幻觉：行为经济学的有限理性“囚笼”

随着偏好内涵不变性假设、外延无关性假设和经济资源的完全可替代性假设被行为经济学家揭示的行为现实所否定，正统经济学基本前提和分析起点——偏好关系预先得到完备界定并在行为过程中保持一致——遭到系统解构，偏好在特定的背景中形成，在特定行为过程中被塑造，并动态、随机演进的观点逐渐成为行为经济学家的主流看法（冯燮刚，李子奈，2006年第4期）。正统经济学理性选择模型是以理性经济人为中心的、封闭的选择模型，属于单极化本质主义范式（李子奈，冯燮刚， 2005；冯燮刚，2005)。在心理现实化和描述性转向研究方向上前行的行为经济学，逐渐放弃了建立封闭的、绝对的规范性理论体系的努力，转向了更加富于弹性的描述性。行为经济学在心理现实化和描述性转向上取得的丰硕成果，迫使研究者们不得不更多地关注行为的背景、社会现实等因素，偏好的学习机制、演化机制和随机过程已经逐渐被纳入研究的中心领域。在行为经济学家看来，旧的框架已经被打破，而新的框架尚未确立。他们面临的任务，已经不再是揭示正统经济学与行为现实的系统偏差，而是如何重构选择行为理论的新的心理基础，整合形成新的分析框架——描述性的选择行为理论。
在最近几年里，为完成对丰富多变的心理现实的综合，行为经济学家在不同角度建立了多种由理性和非理性构成的双系统模型，给出了两个心灵的心理图案（Kahneman and Frederick, 2002; Kahneman, 2003; Loewenstein and Lerner, 2003; Loewenstein and O’donoghue, 2004；Camerer, Ho, and Chong, 2004）。下面我们以Kahneman 等人建构的直觉系统、推理系统构成的双系统模型为例，来分析行为经济学家正在建构的描述性选择行为理论框架。

5.1 直觉和推理双系统模型的基本结构

Kahneman等人建构的双系统思维模型由直觉系统和推理系统组成。直觉系统具有以下与感知系统类似的属性：迅速、自动、联想、无需费力、不易被控制或调整。推理系统具有以下属性：缓慢、连续、费力、被审慎控制、相对灵活、有潜规则须遵循。当然直觉系统并不像感知系统那样，局限于处理各种当前的刺激，直觉判断可以处理知觉、概念，并可以被语言唤醒。而推理系统不仅通过审慎的推理形成判断，还具有监督思维过程和外显行为的功能（Gilbert, 2002，引自 Kahneman, 2003; Stanovich and West, 2002），特别是监督直觉系统的运作。但推理系统的监督非常松散，许多直觉判断得以自由表达，而许多错误也由此而生（Kahneman and Frederick, 2002）。感知系统和直觉系统产生印象，这是所有判断的本源。直觉系统和推理系统则在经验过程中形成的有效判断积累——知识——和印象基础上形成判断。

5.2 可达性启发与判断偏差

与推理系统经过慎密的推理形成判断不同，直觉系统依靠启发过程形成判断。可达性[⑨]是直觉判断分析的核心概念。可达性评价是决策者自然进行的评估过程，是对感知和记忆中认知流利性的自然评估（Kahneman, 2003）。比如就高度或体积判断而言，叠加在一起的方块比一堆散放的方块的思维可达性要强得多。可达性是一个连续区间，在一端具有感知系统和直觉系统的特点：快速、自动、毫不费力；而在另一端具有推理系统的特点：缓慢，连续处理、费力。由于可达性具有感知的显著性、注意的自发性和随意性、反应触发的临时性与联想激活等含义（Kahneman, 2003），决策者的直觉判断不仅要受到与物理背景相关的物理显著性的影响，也会受到历史背景相关的选择性注意影响，还要面对反应触发和联想激活的随机扰动的影响。因此，在行为经济学家看来，外在的刺激与决策者的行为之间的因果关系具有内在的不可预见性。
当选择问题目标属性（比如正统经济学效用最大化理论中效用就是选择问题的目标属性）可达性较弱时，决策者如何进行判断和选择呢？Kahneman and Frederick(2002)建构了属性替代的启发式判断模型：决策者将判断对象之可达性较弱的目标属性替换为与之相关的、思维可达性较强的启发属性，并通过对启发属性的评价来间接形成关于目标属性的判断。简言之，启发式判断就是按照易于想象的原则，对待决事件具体化，以进行判断与选择。实验表明，属性替代的实质是：属性替代使得判断对象发生了变化，反应者答非所问，对他们没有被问及的问题给出了一个合理的解答（Kahneman, 2003）。比如，当被问及两支足球队谁更可能获得比赛的胜利时，我们马上将可能性（目标属性）替换成足球队的实力（启发属性）的比较（比如各个球员的技能、身体素质，球队的战绩等），我们最后回答的并不是哪支球队赢的可能性大，而是哪支球队的实力最强。决策者判断中的很多偏差，比如代表性、小样本、锚定效应产生的偏差等，都可以用判断启发过程中的属性替代来解释。
情感因素也作为一种启发属性，被整合进了Kahneman的双系统模型。有很充分的证据说明每种刺激都激起有意识或无意识的情感评价（Zajonc, 1980; Bargh, 1997, 引自 Kahneman, 2003）。Kahneman, Ritov, and Schkade(1999)指出，自动的情感评价——态度的情感核心——是许多判断和行为的主要决定因素。在Kahneman等人的双系统模型中，把情感反应当作启发属性，可以广泛运用于各种复杂情形。
在Kahneman建立的综合模型中，推理系统作为思维的监督者，参与了所有的随意行为。这隐含着直觉判断错误将可能来自于两个系统的失败：直觉系统产生错误的直觉，且推理系统没能检测并予以修正（Kahneman and Tversky, 1982a；引自 Kahneman, 2003）。尽管判断启发会产生偏差，在推理系统的审慎参与下，人们可以通过在偏差中学习，使在特定环境下直觉判断所违背的规则足够早地进入思维，从而驾驭直觉判断，纠正判断偏差。比如根据模糊性来判断距离，在大雾天会出现偏差。对司机进行训练，让他们掌握大雾天产生距离判断偏差的知识，可以削弱判断偏差的影响。但是由于直觉印象通常首先形成，这将形成后续判断的起点和基础——所谓的锚碇及锚定效应[⑩]，从锚碇开始的修正很难是充分的。因此，直觉判断的偏差并不会完全消除。

5.3 双系统选择行为理论：反射机制和适应机制

我们看到，在Kahneman(2003)提供的选择行为理论框架中，可达性和直觉与感知之间的类比发挥着核心作用。局部选择行为理论（Kahneman and Tverksy, 1979）的核心思想就是变化与差距比绝对水平的刺激的可达性要强得多。在结构化效应中，虽然专业训练可以减少结构化效应中问题的不同描述或展现方式所带来的选择不一致，但是理性选择模型永远必须面对一个具有有限智力的主体，而这个主体将不得不面对缺乏客观陈述的现实。
由于直觉和感觉将根据可达性启发原则形成高度可达的印象，为直觉系统和推理系统形成判断提供基础和起点。因此，直觉决策将被特定情形下的可达性启发所塑造，可达性较强的特征将影响决策，而可达性较弱的特征将基本被忽略。由启发式判断提供的可达性较强的判断或选择，将变成潜在的锚碇，成为后续选择和判断的基础和起点。即使推理系统深思熟虑地予以规范与驾驭，在锚定效应[11]的作用下，推理系统也只能对直觉判断进行逐步的调整。这样，可达性启发与锚定效应将在判断和选择中发挥关键作用。因此，在判断和选择行为中，从很大程度上讲，直觉系统提供了对外界刺激的反射机制，而推理系统则提供了对外界环境的适应机制。在决策者和外部环境的随机互动过程中，直觉系统和推理系统构成的选择系统，决定了决策者高度随机的判断和偏好。

5.4 描述性转向：从完全理性到有限理性

怀着对自然科学理想的追求，正统经济学一直按照理性原则建构经济学体系。但是逻辑上完备、一致的理性原则无法面对不遵循逻辑原则、高度可变的情绪性、本能似的非理性因素，情感等非理性因素长期被正统经济学拒之门外。因此，正统经济学建构了完全理性的自我作为其选择行为理论的心理基础，完全理性成为选择行为的根本依据。
在双系统模型中，我们看到的两个心灵的心理图画对我们来说并不陌生。柏拉图（《理想国》）建构的由理性灵魂、精神灵魂、欲望灵魂组成的马车模型，弗洛伊德建构的由意识和潜意识或者自我、本我和超我组成的心灵模型，与行为经济学家正在建构的二系统模型都是同构的。在这些模型中，我们看到，人类行为既有人类深思熟虑的理性因素，也有人类情绪性、本能似的冲动因素，更有完全由物理背景、人文背景和历史背景激发的因素。
正是由于完全理性的自我仅仅考虑了深思熟虑的理性因素，而没有考虑人类情绪性、本能似的冲动因素和由物理背景、人文背景与历史背景激发的因素，正统经济学选择行为理论与行为现实产生了严重背离。正统经济学选择行为理论心理基础的非现实性，成为行为经济学对正统经济学的选择行为理论进行了系统反动的直接诱因。行为经济学家为了修正正统经济学理论与现实的巨大偏离，引入了非理性的直觉，以兼容人类情绪性、本能似的冲动因素和由物理背景、人文背景和历史背景激发的因素。但是，在传统的理性框架下，直觉并不遵循逻辑规则，只能理解、描述。由此，行为经济学放弃了先入为主的规范性理想，转向了描述性，建构了由理性和非理性系统组成的有限理性。

第6节将逃亡进行到底：逃出柏拉图“囚笼”与行为经济学解构

怀着对自然科学理想的追求，正统经济学一直按照理性原则建构经济学体系，完全理性的自我成为其选择行为理论的心理基础，并成为选择行为的根本依据。但是逻辑上完备、一致的理性原则无法面对不遵循传统理性原则、高度可变的情绪性、本能似的冲动因素和由物理背景、人文背景与历史背景激发的因素，正统经济学选择行为理论与行为现实产生了严重背离。行为经济学由此对正统经济学的选择行为理论进行了系统反动，并最终系统解构（冯燮刚，李子奈，2006年第7期）了正统经济学的完全理性，放弃了规范性理想，转向了描述性，建构了由理性和非理性系统组成的有限理性。但是，由于仍然试图在主体的一端寻找主体和其身处的环境之间的互动行为的原因，行为经济学也没能跳出单极化本质主义（李子奈，冯燮刚，2005；冯燮刚，2005）的思想框架。
在以选择主体为中心的单极化本质主义范式之下，正统经济学也好，行为经济学也罢，决策者自主判断，自主选择，正确也好，错误也罢，一个判断和选择的自我是我们自己行为的主人，是经济学为丰富多变的行为现实确定的终极依据。在哲学完成本体论到认识论的转向后，“人是万物的尺度”[12]，自我理所当然地成为我们所及的世界的中心，所有哲学社会科学知识的建构几乎无一例外地陷入了以主体为中心的单极化本质主义。不过主体的形象一直在发生变化，从与上帝相通的灵魂（笛卡尔，1996）到先验自我（康德，2003），从先验自我到心理自我，而心理自我的建构则更是五花八门。行为经济学在当代建构的依靠直觉和推理双系统进行判断和选择的有限理性自我，实际上是对约两千五百年前柏拉图马车模型（2002）的回归。
正象经济学家目前所完成的大量研究揭示的那样，在人类行为中，既有人类深思熟虑的理性因素，也有人类情绪性、本能似的冲动因素，更有完全由物理背景、人文背景和历史背景激发的因素。后两方面的因素是决策者和环境之间的互动行为，直接被决策者和环境之间的互动过程所决定，无法单一地归于决策者的心理本质。事实上，只要我们坚持在我们的心灵中寻找行为的所有原因，这两方面就只能归于传统理性所不及的启发、直觉、潜意识、本我或其他类似的神秘过程。试图依靠决策者本身的属性来为决策者与环境之间的互动行为提供一致的说明，这正是以主体为中心的单极化本质主义范式无法解决的一致性困难。

第7节小结

行为经济学对柏拉图马车模型的回归是意味深长的，也是历史性的。它彰显了经济学目前所面临的困境——深深地陷入单极化本质主义的结构化陷阱（冯燮刚，李子奈，2006年第4期）。如图5所示。正像我们行为经济学当代的研究成果中所看到的，在人类行为中，既有人类深思熟虑的理性因素，也有人类情绪性、本能似的冲动因素，更有完全由物理背景、人文背景和历史背景激发的行为博弈、社会效用、序贯行为等因素。在传统的理性自我框架下，后两方面的因素直接被决策者和环境之间的互动过程所决定，不遵循逻辑原则，是非理性的。行为经济学引入非理性的直觉，建构了有限理性的双系统模型，试图为人类行为后两面的内容提供描述性框架。但是，作为对完全理性反动的产物，行为经济学仍然局限于在选择主体一极寻找选择行为的终极依据，其建构的有限理性仍然没有跳出单极化本质主义的结构化陷阱。只要我们还在以选择为主体中心的单极化本质主义范式下，试图仅仅依靠决策者本身的属性来为决策者与环境之间的互动行为提供一致的说明，就是不可能完成的任务。

图5 将逃亡进行到底：逃离本质主义范式
要摆脱正统经济学身处的单极化本质主义结构化陷阱，必须迈出更为关键的一步，放弃以选择主体为中心的单极化本质主义，转向开放的、演进的关系论（冯燮刚，李子奈，2006年第4期；李子奈，冯燮刚，2005），立足关联互动的现实世界，以“公度性”（李子奈，冯燮刚，2005）为基本准则，在决策者和环境之间的互动过程中确定行为依据和对行为的描述框架，建构开放的、演进的经济学知识体系。因此，行为经济学对柏拉图马车模型的回归并不是重复性的回归，而是螺旋上升过程中的回归，它勾画出更为丰富、全面、现实的人类行为图像。在丰富的行为现实中，经济学深层次的矛盾一览无余，经济学的关系论转向逐渐变得清晰起来，这将成为经济学走上希望之路的起点。

[①] 本部分的部分内容刊载在《经济学动态》2006年第7期。
[②] 选美博弈来自于John Maynard Keynes的隐喻，他把股票市场比作选美竞赛。在选美竞赛中，人们关注的是其他人会认为哪个竞争者漂亮，而不是谁真正最漂亮。在股票市场当中，投机者关心的并非股票的真实价值，而是市场认为股票有什么价值 (Camerer, 2003).
[③] 在该模型中，思维步骤为零的参与者随机选取行为策略；思维步骤为一步的参与者，被假定过份自信地相信其他人都是零步思维者；……；K步思维者则自信地相信其他人都是K-1步思维者。
[④] 李子奈，冯燮刚（2005）以及博兰（1997）的分析表明，“效用最大化”是不可反驳的。在终极交易情形中，在正统经济学家看来，行为经济学家没有找到使之最大化的效用。
[⑤] 关于确定随机世界的这类理论数不胜数。而在模糊随机世界当中，也有相当多的理论，比如Craig and Tversky(1998)给出了基于信仰的两阶段模型，用于解决概率分布不确定条件下的决策问题。一、在模糊随机世界中进行概率判断的支持理论：主观概率被赋予事件的描述，而不是事件本身。而主观概率的大小，决定于支持事件描述的证据强弱。证据支持信仰 (概率具有次可加性)；二、在确定随机世界中进行决策的局部选择行为理论。
[⑥] 根据Kahneman(2003)建构的可达性启发判断理论，当记忆中一片空白，或者具有相似性的情形集合为空时，人类的判断与选择不会受制于类比的逻辑法则，而会按照启发性原则，发生思维的跳跃，很难说待决事件会如何和记忆中和现实中的哪些情形发生关联。
[⑦] 直到近现代，经过叔本华、尼采和弗洛伊德等人的努力，学者们才开始系统地研究非理性力量。但追求自然科学理想的主流学者们仍然对非理性力量的研究望而却步。
[⑧] 后文的分析表明，情感因素只是不能见容于单极化本质主义的知识框架，但却完全可以纳入关系论的知识框架。
[⑨] 指特定思想内容进入思维的容易程度(Higgins, 1996, 引自Kahneman, 2003；Tversky and Kahneman, 1974)。
[⑩] 我们用Ariely, Loewenstein,and Prelec（2003）的实验来说明锚碇和锚定效应。对被试提出是否愿意接受以他们的社会安全号后两位作为购买价格的问题后（无论回答是否），在对无线键盘的定价中，社会安全号后处于00-20的被试的平均定价为$16.09，而处于80-99的被试的平均定价为$55.64。实验表明，由于被试对无线键盘的价格信息了解不充分，在与无线键盘定价不直接相关的陈述中，被试会形成赖以进行判断或选择的基准——就像抛锚之锚碇，从而影响了价值判断。
[11] 见前注。
[12] 同样的一句话，古希腊时代的普罗泰戈拉和19世纪的康德借以表达的含义则完全不同，前者借以表达感觉的无常性和特殊性，后者则借以表达先验自我的永恒性和普遍性（冯燮刚，200408）。

举报/Report

我的更多文章

下载客户端阅读体验更佳

APP专享

新浪博客

逃离有限理性“囚笼”：经济学的困境与行为经济学的解构

经济学大逃亡研究系列3