1.自然选择。采用高得益策略的人与那些采用低得益策略的人相比,更容易重复自己的策略;因而长期来看后者在人群中的比例将会减小。这种情形的标准模型是复制动态,人群中某一策略的增长率被假定为相对于平均得益的得益的线性函数。在这一背景下,得益是指复制的成功率,而非个人对于结果的偏好。<br> 2.模仿。人们模仿别人的行为,尤其是那些流行的或者看上去产生高收益的行为。模仿可能纯粹是由行为的流行性驱使的(模仿你见到的第一个人),或者在得益与模仿(或被模仿)的倾向之间可能存在某种相关性。例如,当事人可能会模仿他们所见到的第一个人,其模仿的概率与他们自己得益负相关,而与那些他们想要模仿的人的得益正相关。与自然选择相对照,在这一模型下的得益描述了人们是如何选择的,而不是他们繁殖得有多快,这就与我们想要研究的适应性学习情形更为一致了。然而要使模型合理,个人的得益就必须是他人所能观察到的,这一假定并非总能得到满足。<br> 3.强化。人们倾向于采用在过去产生高收益的行动,而避免产生低收益的行动。这是行为心理学中标准的学习模型,并正越来越引起经济学家的注意。正如在模仿模型中,得益描述了选择行为,但重要的只是自己在过去的得益,而不是别人的得益。基本前提是现在采取某一行动的概率是随着过去实施该行动所获得益的增加而增加的。
展开