版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
决策理论3-效用函数3效用函数3.1引言3.2效用的定义和公理系统3.3效用函数的构造3.4风险与效用3.5货币的效用3.6阿莱斯悖论(Allais’sparadox)决策理论3-效用函数3.1引言在定量评价可能的行动的各种后果时,会遇到两个主要问题:(1)后果本身是用语言表述,可能没有任何合适的直接测量标度。(2)即使有一个明确的标度可以测量后果,按这个标度测得的量也可能并不反映后果对决策人的真正价值。决策理论3-效用函数3.1引言这个例子说明:即使是数值量表示的后果,它对决策人的实际价值仍有待确定。0实际价值100钱100100100000例3.1考虑钱对同一个人的价值。假设一个学生手头紧张,正好有机会挣100元钱,但是所要做的是他相当讨厌的工作。(1)如他经济情况差,他会认为100元钱的实际价值足够大,所要做的工作即使是相当讨厌的,他仍会去干;(2)如他先有了10000元,要为100元钱去干这份让他讨厌的工作,他就很可能不干了。
决策理论3-效用函数3.1引言例3.2决策人面临图3.1中决策树所示的选择:①确定收入礼品1000元;②参与一次抽奖:有50%的机会得0元,50%的机会得2500元。有人选确定性的1000元的收入。抽奖的期望值虽大,风险也大,实际价值还不如保险的1000元。而有人认为礼品不如抽奖,因为抽奖提供了获得2500元的机会。这个例子说明:决策人的风险态度影响其对后果的实际价值判断。决策理论3-效用函数圣彼得堡悖论
(St.PetersburgParadox/game)圣彼得堡悖论是数学家丹尼尔·伯努利(DanielBernoulli)的表兄尼古拉·伯努利(NicolausBernoulli)在1738提出的一个概率期望值悖论,它来自于一种掷币游戏,即圣彼得堡游戏(表1)。问题:你愿意花100元来参加一次圣彼得堡游戏吗?决策理论3-效用函数圣彼得堡悖论的解释1:(一)边际效用递减论DanielBernoulli在提出这个问题的时候就给出一种解决办法。他认为游戏的期望值计算不应该是金钱,而应该是金钱的期望效用,即利用众所周知的“期望效用递减律”,将金钱的效用测度函数用货币值的对数来表示:效用=log(货币值),如表2所示。所有结果的效用期望值之和将为一个有限值log(4)≈0.60206,如果这里的效用函数符合实际,则理性决策应以4元为界。决策理论3-效用函数圣彼得堡悖论的解释2:(二)风险厌恶论圣彼得堡悖论对于奖金额大小没有限制。比如连续投掷40次才成功的话,奖金为1.1万亿元。但是这一奖金出现的概率极小,1.1万亿次才可能出现一次。实际上,游戏有一半的机会,其奖金为2元,四分之三的机会得奖4元和2元。奖金越少,机会越大,奖金越大,机会越小。Hacking(1980)所说:花25元的费用冒险参与游戏将是非常愚蠢的,虽有得大奖的机会,但是风险太大。因此,考虑采用风险厌恶因素的方法可以消解矛盾。PualWeirich就提出在期望值计算中加人一种风险厌恶因子,并得出了游戏费用的有限期望值,认为这种方法实际上解决了该悖论。决策理论3-效用函数圣彼得堡悖论的解释3:(三)效用上限论也有一种观点认为奖金的效用可能有一个上限,这样,期望效用之和就有了一个极限值。Menger认为效用上限是惟一能消解该悖论的方法。设效用值等于货币值,上限为100单位,则游戏的期望效用为7.56l25,如表3所示。决策理论3-效用函数圣彼得堡悖论的解释4:(四)结果有限论Gustason认为,要避免矛盾,必须对期望值概念进行限制,其一是限制其结果的数目;其二是把其结果值的大小限制在一定的范围内。这是典型的结果有限论,这一观点是从实际出发的。因为实际上,游戏的投掷次数总是有限的数。比如对游戏设定某一个投掷的上限数L,在投掷到这个数的时候,如果仍然没有成功,也结束游戏,不管你还能再投多少,就按照L付钱。因为你即便不设定L,实际上也总有投到头的时候,人的寿命总是有限的,任何原因都可以使得游戏中止。现在设定了上限,期望值自然也就可以计算了。决策理论3-效用函数3.1引言由上面例子可知:在进行决策分析时,存在如何描述或表达后果对决策人的实际价值,以便反映决策的人心目中各种后果的偏好次序(preferenceorder)的问题。偏好次序是决策人的个性与价值观的反映,它与决策人所处的社会地位、经济地位、文化素养、心理和生理(身体)状态有关。决策理论3-效用函数3.2效用的定义和公理系统3.2.1效用的定义3.2.2效用存在性公理3.2.3效用的公理化定义和效用的存在性3.2.4基数效用与序数效用决策理论3-效用函数3.2.1效用的定义效用(utility):消费者从消费商品中得到的满足程度。效用完全是消费者的一种主观心理感受。满足程度越高,效用越大;满足程度越低,效用越小。决策理论3-效用函数对效用的理解:《最好吃的东西》兔子和猫争论,世界上什么东西最好吃。兔子说,“世界上萝卜最好吃。萝卜又甜又脆又解渴,我一想起萝卜就要流口水。”猫不同意,说,“世界上最好吃的东西是老鼠。老鼠的肉非常嫩,嚼起来又酥又松,味道美极了!”兔子和猫争论不休、相持不下,跑去请猴子评理。猴子听了,不由得大笑起来:“瞧你们这两个傻瓜蛋,连这点儿常识都不懂!世界上最好吃的东西是什么?是桃子!桃子不但美味可口,而且长得漂亮。我每天做梦都梦见吃桃子。”兔子和猫听了,全都直摇头。那么,世界上到底什么东西最好吃?以上的故事说明效用完全是个人的心理感觉。不同的偏好决定了对同一种商品效用大小的不同评价。决策理论3-效用函数3.2.1效用的定义在决策理论中,后果对决策人的实际价值,即决策人对后果的偏好次序是用效用(utility)来描述的。效用就是偏好的量化,是数(实值函数)。1738年,DanielBernoulli就指出:若一个人面临从给定行动集(风险性展望集)中作选择的决策问题,如果他知道与给定行动有关的将来的自然状态,且这些状态出现的概率已知或可以估计,则他应选择对各种可能后果的偏好的期望值最高的行动。决策理论3-效用函数一、效用的基本概念与符号(1)严格序“”ab(或者记作aPb)的含义是“a优于b”(aispreferredtob);也就是说,若非外界因素的强迫,决策人只会选择a而不会选择b。决策理论3-效用函数一、效用的基本概念与符号(2)无差异“~”a~b(或记作aIb)的含义是“a无差异于b”(aisindifferencetob);也就是说,决策人对选择或同样满意。决策理论3-效用函数一、效用的基本概念与符号(3)弱序“≥”记作aRb,含义是“a不劣于b”,亦即a优于或者无差异于b。决策理论3-效用函数一、效用的基本概念与符号(4)展望(prospect)展望指决策的可能的前景,即各种后果及后果出现的概率的组合,记作P=<p1,c1;p2,c2;…;pr,cr;>.在例3.2的决策问题中,后果集C={1000,2500,0},采取行动a1和a2时的展望分别是:P1=<1.0,1000;0,2500;0,0>P2=<0,1000;0.5,2500;0.5,0>决策理论3-效用函数
(4)展望(prospect)
展望既考虑各种后果Ci,又考虑了各种后果出现的概率(客观概率pi或主观概率πi),全面地描述了在决策问题中采取某种行动的可能前景。决策理论3-效用函数复合展望决策理论3-效用函数一、效用的基本概念与符号(5)抽奖与确定当量由机会点和该机会点发出的n个机会枝的概率及相应后果构成的图形称为抽奖(lottery),抽奖又称彩票。若C1~(p,C2;(1-P),C3),
则称确定性后果C1为抽奖(p,C2;(1-P),C3)的确定当量(certaintyequivalent)。决策理论3-效用函数二、效用的定义根据上述讨论和记号,可以初步给出效用函数的定义如下。定义3.1在集合P上的实值函数u,若它和P上的优先关系≥一致,即:若P1,P2属于P,P1≥P2当且仅当u(P1)≥u(P2),则称u为效用函数。把效用函数定义在展望集P上而不是定义在后果集C上,是为了使效用函数能够反映决策人对风险的态度。决策理论3-效用函数3.2.2效用存在性公理定义3.1给出了效用函数的最基本性质,这就是可以根据它的大小来判断展望P的优劣。但是这样的效用函数是否一定存在呢?回答是不一定。至于决策人的价值判断在满足什么条件时存在与之一致的效用函数,vonNeumann-Morgenstern(1944)给出了效用的存在性公理,又称理性行为公理。决策理论3-效用函数3.2.2效用存在性公理决策理论3-效用函数式(3.3)推导:P1P2αP1+(1-α)P1αP2+(1-α)P2αP1+(1-α)P3αP2+(1-α)P3
公理3.3表明两个有序的展望各有相同的比例被相等的量替代后,优先关系不变.决策理论3-效用函数例3.3横过马路问题:效用有界性证明决策理论3-效用函数3.2.3效用的公理化定义和效用的存在性决策理论3-效用函数3.2.3效用函数的存在性决策理论3-效用函数3.2.4基数效用与序数效用基数:为实数,如1,2,3,π序数:如第一,二,…,4,3,2,1基数性效用函数与序数效用函数区别:基数效用定义在展望集P上(考虑后果及其概率分布),是实数;序数效用定义在后果集C上,不涉及概率,可以是整正数.基数效用反映偏好强度(正线性变换下唯一,即原数列可变换为:b+c,2b+c,3b+c,100b+c;其中b,c∈R1,b>0.)序数效用不反映偏好强度,(保序变换下唯一),原序数列可变换为16,9,4,1;或8,6,4,2,或10,7,6,1等.决策理论3-效用函数3.2.4基数效用与序数效用基数(cardinalnumber)效用:边际效用分析方法总效用(TOTALUTILITY,TU):消费者在一定时间内从一定数量商品的消费中所得到的效用量的总和;边际效用(MARGINALUTILITY,MU):消费者在一定时间内增加一单位商品的消费所得到的效用量的增量.序数(ordinalnumber)效用:无差异曲线分析方法希克斯认为,效用的数值表现只是为了表达偏好的顺序,并非效用的绝对数值。现在比较通用的是序数效用。决策理论3-效用函数3.3效用函数的构造1.估计效用函数值的方法2.离散型后果的效用设定3.连续型后果的效用函数构造4.用解析函数近似效用曲线决策理论3-效用函数1.估计效用函数值的方法⑴概率当量法⑵确定当量法⑶增益当量法⑷损失当量法
从纯理论角度看,这四种方法并没有实质性的区别;但是实验结果表明,使用确定当量法时决策人对最优后果(增益)的保守性和对损失的冒险性都比概率当量法严重(Hershey,1982);采用增益当量法与损失当量法时产生的误差也比用概率当量法大,因此只要有可能,应该尽可能使用概率当量法。决策理论3-效用函数⑴概率当量法决策理论3-效用函数2.离散型后果的效用设定后果为离散型随机变量时,后果集C中元素为有限个,构造后果集上的效用函数有两方面的内容:(1)确定各后果之间的优先序;(2)确定后果之间的优先程度。离散型后果效用值的设定可以采用概率当量法,简称NM法。决策理论3-效用函数NM法步骤如下:决策理论3-效用函数例3.6例3.6天气预报说球赛时可能有雨,一个足球爱好者要决定是否去球场看球。首先作该问题的决策树如图所示。由题意可知决策人对四种后果优劣的排序是:c2c3c4c1。决策理论3-效用函数步骤:第一步:令u(c1)=0,u(c2)=1。第二步:询问决策人,下雨在家看电视这种后果与去球场看球有多大概率下雨被淋相当,若决策人的回答是0.3,则c30.7c2+0.3c1,u(c3)=0.7u(c2)=0.7。第三步:询问决策人,无雨看电视这种后果与去球场看球有多大概率下雨被淋相当,若决策人的回答是0.6,则c40.4c2+0.6c1,得u(c4)=0.4c2=0.4。第四步:进行一致性校验。c30.4c2+0.6c4,则u’(c3)=0.64≠0.7。重复二、三,若u(c3)不变,则调整u(c4)=0.5,决策人仍认为c30.4c2+0.6c4,则通过校验。决策理论3-效用函数3.连续型后果的效用函数构造当后果c为连续变量时,上述方法就不再适用。但是如果能通过分析找到u(c)的若干特征值,求特征点的效用后,再连成光滑曲线;或者u(c)是连续、光滑的,则可以分段构造u(c)。决策理论3-效用函数每天学习时间与效用随着学习时间的增加,效用值也会有所增加但是由于进入状态需要一定的时间,所以在t较小时,效用的增加较慢;过了一小段时间后,效用与所化时间基本上是线性关系;随着学习时间的不断增加,人会疲劳,效率会下降;时间太长,这时的效果不如时间适度,即存在效用值最大的点tm;再增加学习时间又会从效用最大值处下降。其中与效用最大值对应的tm是因人而异。由于效用函数的惟一性(即在正线性变换下惟一,见效用的公理化定义),效用的值域可以是整个实轴,而不必限于[0,1]区间。决策理论3-效用函数4.用解析函数近似效用曲线为了分析和运算方便,分析人员通常希望能够用某种解析函数式u(x)来近似地表达效用。常用的函数有幂函数和对数函数.决策理论3-效用函数3.4风险与效用3.4.1风险的含义3.4.2效用函数包含的内容3.4.3相对风险态度决策理论3-效用函数3.4.1风险的含义风险包含有两个方面的内容:(1)后果的损失严重程度;(2)出现损失的可能性的大小.一般的,可以用以下几种指标来度量风险。决策理论3-效用函数(1)方差决策理论3-效用函数(2)自方差决策理论3-效用函数(3)临界概率决策理论3-效用函数(4)Fishburn的风险定义决策理论3-效用函数3.4.2效用函数包含的内容1.对风险的态度2.对后果的偏好强度3.可测价值函数决策理论3-效用函数1.对风险的态度如图所示为几种典型的效用函数曲线。曲线A是下凹的,曲线N是线性的,曲线P是凸函数。这三种形状的曲线分别反映了决策人的三种风险态度:风险厌恶(riskaversion)、风险中立(riskneutralness)和风险追求(riskproneness)。决策理论3-效用函数风险酬金决策理论3-效用函数2.对后果的偏好强度考察一下钱的边缘价值:设某人现有积蓄为0,增加1000元对此人的作用(价值)与有了1000元后再加1500元相等,则此人的财富的价值函数是凹函数,如右图。若询问货币后果对这个决策人的实际价值即效用时,决策人认为1000元(0.5,0;0.5,2500),则与其说此人是风险厌恶不如说他是相对风险中立。为此有必要对确定性后果的偏好强度加以量化,这就是可测价值函数。决策理论3-效用函数3.可测价值函数——确定性后果偏好强度的量化定义:在后果空间X上的实值函数v,对w,x,y,z∈X有I、(w→x)>(y→z)当且仅当v(w)-v(x)≥v(y)-v(z),II、v对正线性变换是唯一确定的。则称v为可测价值函数。可测价值函数的示意图如右。决策理论3-效用函数3.可测价值函数决策理论3-效用函数3.4.3相对风险态度决策人的真实的风险态度被称作相对风险态度(relativeriskattitude)。设效用函数和测价值函数在上都是单调递增,且连续二次可微。1.效用函数反映的风险的局部测度>0u在x处凹,风险厌恶r(x)=-u”(x)/u’(x)=0u在x处线性,风险中立<0u在x处凸,风险追求2.可测价值函数反映的偏好强度的局部测度>0在x处有递减的边缘价值m(x)=-v”(x)/v’(x)=0在x处有不变的边缘价值<0在x处有递增的边缘价值3.决策人真正的风险态度若r(x)>m(x),称为在x处相对风险厌恶r(x)=m(x),称为在x处相对风险中立r(x)<m(x),称为在x处相对风险追求决策理论3-效用函数3.5货币的效用决策理论3-效用函数3.6阿莱斯悖论(Allais’sparadox)法国经济学家、诺贝尔经济学奖获得者阿莱斯(Allais,1953)进行了彩票选择实验。实验中,被试者被要求在两组彩票组合中分别进行选择:决策理论3-效用函数推导(1):假设:u($5m)=1,u($0m)=0。如果决策人选择X,则有:0.9u($0)+0.1u($5m)>0.89u($0)+0.11u($1m)0.1>0.11u($1m)0.1/0.11>u($1m)
u($1m)<0.1/0.11决策理论3-效用函数推导(2):假设:u($5m)=1,u($0m)=0。如果决策人选择A,则有:u($1m)>0.89u($1m)+0.1u($5m)+0.01u($0m)u($1m)>0.89u($1m)+0.1u($1m)>0.1/0.11决策理论3-效用函数“阿莱斯悖论”的启示:“阿莱斯悖论”的解释:人们偏好确定性的结果,而厌恶不确定性的结果。(即人的效用函数往往低估一些只具有可能性的结果,而相对高估确定性的结果。)“阿莱斯悖论”说明了真实的个体决策行为会系统地违反期望效用理论中的期望效用最大化原理,从而动摇了决策科学的理论基石。决策理论3-效用函数效用理论的最新成果:卡尼曼和特沃斯基(KahnemanandTversky,1979)提出的展望理论(prospecttheory)。他们对促使人们无法做出符合传统理性决策模型的因素归纳出三个效果:决策理论3-效用函数1)确定效果(certaintyeffect)
在下命两个博彩间进行选择:博彩A:33%的机会得到2500元,66%的机会得到2400元,1%的机会什么也得不到;博彩B:100%的机会得到2400元。现在考虑下面两个博彩:博彩C:33%的机会得到2500元,67%的机会什么也得不到;博彩D:34%的机会得到2400元,66%的机会什么也得不到。决策理论3-效用函数1)确定效果(certaintyeffect)在A和B中,问卷的结果显示有82%的受访者选择博彩B。在C和D中问卷显示有83%的人选择了博彩C。根据期望效用理论,在第一个博彩中:0.33U(2500)+0.66U(2400)<U(2400),即0.33U(2500)<0.34U(2400);但是在第二个博彩中却有0.33U(2500)>0.34U(2400),两者在逻辑上矛盾。产生矛盾的原因是,人们在面临不确定性时的选择表现出一些与传统的效用理论不符的特征,人的效用函数低估一些只具有可能性的结果,而相对高估确定性的结果,称之为确定效果。决策理论3-效用函数2)反射效果(reflectioneffect)
在下命两个博彩间进行选择:博彩A:80%的机会得到4000元;博彩B:100%的机会得到3000元。现在考虑下面两个博彩:博彩C:80%的机会损失4000元;博彩D:100%的机会损失3000元。决策理论3-效用函数2)反射效果(reflectioneffect)在A和B中,问卷的结果显示有80%的受访者选择博彩B。在A和B中,问卷
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025版酒店客房保洁员劳动合同规范范本3篇
- 2025年度企业级打印机与扫描仪设备集成解决方案合同3篇
- 2025年度牛羊养殖户农产品质量安全监管合同3篇
- 二零二五年度报关销售合同范本外贸货物进口指导3篇
- 二零二五年度新建住宅区环评咨询及风险评估合同3篇
- 2024版个人承包电工合同
- 2025年度宠物狗宠物用品进出口代理合同3篇
- 2024电子数据交换平台建设合同标的及属性
- 2024高端装备制造业出口信贷合同
- 二零二五年度环保项目实施许可合同2篇
- 2025年湖南出版中南传媒招聘笔试参考题库含答案解析
- 2025年度商用厨房油烟机安装与维护服务合同范本3篇
- 2024年03月恒丰银行2024年春季招考毕业生笔试历年参考题库附带答案详解
- 网络安全系统运维方案
- ISO 56001-2024《创新管理体系-要求》专业解读与应用实践指导材料之14:“6策划-6.3变更的策划”(雷泽佳编制-2025B0)
- 2024年特厚板行业现状分析:中国特厚板市场占总销售量45.01%
- 2025年中国地质调查局乌鲁木齐自然资源综合调查中心招聘19人历年管理单位笔试遴选500模拟题附带答案详解
- 中国儿童重症监护病房镇痛和镇静治疗专家共识2024解读
- 音乐老师年度总结5篇
- 2024版商标许可使用合同与商标授权协议3篇
- 学生学情分析报告范文
评论
0/150
提交评论