第二讲效用函数_第1页
第二讲效用函数_第2页
第二讲效用函数_第3页
第二讲效用函数_第4页
第二讲效用函数_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二讲效用函数第1页,共59页,2023年,2月20日,星期一对效用的理解:《最好吃的东西》兔子和猫争论,世界上什么东西最好吃。兔子说,“世界上萝卜最好吃。萝卜又甜又脆又解渴,我一想起萝卜就要流口水。”猫不同意,说,“世界上最好吃的东西是老鼠。老鼠的肉非常嫩,嚼起来又酥又松,味道美极了!”兔子和猫争论不休、相持不下,跑去请猴子评理。猴子听了,不由得大笑起来:“瞧你们这两个傻瓜蛋,连这点儿常识都不懂!世界上最好吃的东西是什么?是桃子!桃子不但美味可口,而且长得漂亮。我每天做梦都梦见吃桃子。”兔子和猫听了,全都直摇头。那么,世界上到底什么东西最好吃?以上的故事说明效用完全是个人的心理感觉。不同的偏好决定了对同一种商品效用大小的不同评价。第2页,共59页,2023年,2月20日,星期一圣彼得堡悖论

(St.PetersburgParadox/game)

圣彼得堡悖论是数学家丹尼尔·伯努利(DanielBernoulli)的表兄尼古拉·伯努利(NicolausBernoulli)在1738提出的一个概率期望值悖论,它来自于一种掷币游戏,即圣彼得堡游戏(表1)。问题:你愿意花100元来参加一次圣彼得堡游戏吗?第3页,共59页,2023年,2月20日,星期一§2.1

理性行为公理问题: 某公司拟推出一种新产品,经预测该产品在市场看好的情况下,可以获利10万;在市场前景较差时,将亏损1万元。市场看好和较差的概率分别为0.6和0.4,是否推出该新产品? 若另有一产品可稳获利2万元,推出哪种产品更好? 这是一个随机决策问题。第4页,共59页,2023年,2月20日,星期一§2.1

理性行为公理 在随机决策中,决策系统中的决策方案均是在状态空间背景中加以比较,并按照某种规则,选出决策者最满意的行动方案。 在本章中,我们用事态体表示在随机性状态空间中的行动方案,方案的比较表示为事态体的比较,并引入效用的概念,用以衡量事态体(行动方案)的优劣。第5页,共59页,2023年,2月20日,星期一§2.1

理性行为公理2.1.1事态体及其关系1.事态体的概念

定义2.1

具有两种或两种以上有限个可能结果的方案(或事情),称为事态体。 事态体中各可能结果出现的概率是已知的。 事态体即随机性状态空间中的行动方案。第6页,共59页,2023年,2月20日,星期一1.事态体的概念 设某事态体的n个可能结果为:

o1,o2,…,on

各结果出现的概率是相应为:

p1,p2,…,pn

则该事态体记为:

T=(p1,o1;p2,o2;…;pn,on)特别当n=2时,称T为简单事态体,此时

T=(p,o1;1-p,o2)第7页,共59页,2023年,2月20日,星期一1.事态体的概念 事态体可以用树形图表示如下:Tp1p2︰︰︰pno1o2︰︰︰on当n=2时:pT1-po1o2第8页,共59页,2023年,2月20日,星期一事态体集合Ŧ的性质①在凸线性组合下,Ŧ是闭集。即: 若T1∈Ŧ,T2∈Ŧ,则当0≤λ≤1时,有

λT1+(1-λ)T2∈Ŧ

两个事态体的凸线性组合仍是一个事态体。②T=(0,o1;0,o2;…;1,oj;…;0,on)∈Ŧ 称T为退化事态体。

退化事态体仍属于事态体集合。第9页,共59页,2023年,2月20日,星期一2.事态体的比较定义2.2

设o1,o2是事态体T的任意两个结果值,根据决策目标和决策者偏好,o1和o2有如下关系:①若偏好结果值o1,则称o1优于o2,记作o1o2;反之,称o1劣于o2,记作o1

o2。②若对结果值o1,o2无所偏好,则称o1无差异于o2,记作o1~o2。③若不偏好结果值o1,则称o1不优于o2,记作o1≼o2;反之,称o1不劣于o2,记作o1

≽o2。第10页,共59页,2023年,2月20日,星期一2.事态体的比较定义2.3

设两个简单事态体T1,T2具有相同的结果值o1,o2,即:T1=(p1,o1;1-p1,o2) T2=(p2,o1;1-p2,o2) 并假定o1o2,则:①若p1=p2,称事态体T1无差异于T2,记作T1~T2。②若p1>p2,称事态体T1优于T2,记作T1T2;反之,称事态体T1劣于T2,记作T1

T2。第11页,共59页,2023年,2月20日,星期一2.事态体的比较定义2.4

设两个简单事态体T1,T2仅具有一个相同结果值,另一个结果值不相同,即: T1=(p1,o1;1-p1,o0) T2=(p2,o2;1-p2,o0) 且o2

o1o0,①若p1≤p2,则事态体T2优于T1,记作T2T1。②若T1~T2,则必有p1>p2。第12页,共59页,2023年,2月20日,星期一§2.1

理性行为公理2.1.2理性行为公理公理2.l(连通性,可比性)

事态体集合Ŧ上事态体的优劣关系是连通的。即若 T1,T2∈Ŧ 则或者T1T2,或者T2T1,或者T1~T2,三者必居其一。表示任意两个事态体都是可以比较其优劣的!第13页,共59页,2023年,2月20日,星期一§2.1

理性行为公理2.1.2理性行为公理公理2.2(传递性)

事态体集合Ŧ上事态体的优劣关系是传递的。即若 T1、T2、T3∈Ŧ,且T1T2,T2T3,则必有 T1T3。 表示任意多个事态体的优劣是可以排序的(若有些事态体无差异,可排在同一位置。)

满足公理2.1和公理2.2的事态体集合称为全序集。

第14页,共59页,2023年,2月20日,星期一§2.1

理性行为公理2.1.2理性行为公理公理2.3(复合保序性,替代性)

若 T1,T2,Q∈Ŧ,且0<p<1,则T1T2当且仅当

pT1+(1-p)Q

pT2+(1-p)Q。 表示任意事态体的优劣关系是可以复合的,复合后的事态体保持原有的优劣关系不变。第15页,共59页,2023年,2月20日,星期一§2.1

理性行为公理2.1.2理性行为公理公理2.4(相对有序性,连续性,偏好的有界性)

若 T1,T2,T3∈Ŧ,且T1T2T3则存在数p,q,0<p<l,0<q<1,使得:

pT1+(1-p)T3

T2

qT1+(1-q)T3

表示任意事态体都不是无限优,也不是无限劣。第16页,共59页,2023年,2月20日,星期一§2.1

理性行为公理2.1.3事态体的基本性质性质2.1

设事态体

T1=(p,o1;1-p,o0) T2=(x,o2;1-x,o0) 且 o1o0,

o2o0,若o2o1 则存在 x=p’<p 使得

T1~T2 称x为可调概率值。第17页,共59页,2023年,2月20日,星期一§2.1

理性行为公理2.1.3事态体的基本性质性质2.2(确定当量和无差异概率)

设事态体T=(x,o1;1-x,o2)且o1o2。则对于满足优劣关系o1oξ

o2的任意结果值oξ,必存在x=p(0<p<l),使得

T=(p,o1;1-p,o2)~oξ 称结果值oξ为事态体T的确定当量,称p为oξ关于o1与o2的无差异概率。第18页,共59页,2023年,2月20日,星期一2.1.3事态体的基本性质性质2.3

任一事态体无差异于一个简单事态体。 设有事态体T=(p1,o1;p2,o2;…;pn,on)则必存在一个简单事态体

T’=(p’,o*;1-p’,o0

)~T其中: o*≽max{o1,o2,…,on} o0≼min{o1,o2,…,on}且:这里,qj(j=1,2,…,n)为oj关于o*与o0的无差异概率。第19页,共59页,2023年,2月20日,星期一2.1.3事态体的基本性质根据性质2.3

比较一般事态体之间的优劣关系,可以转化为比较简单事态体之间的优劣关系(将问题简化)

得到事态体之间两两的优劣或无差异关系后,再根据公理2.2(传递性)即可得到所讨论事态体的排序。第20页,共59页,2023年,2月20日,星期一§2.2

效用函数的定义和构造 设有决策系统,在离散情况下,结果值可以表示为决策矩阵:第21页,共59页,2023年,2月20日,星期一§2.2

效用函数的定义和构造 矩阵O的第i行表示第i个可行方案的n个可能结果值,即事态体

Ti=(p1,oi1;p2,oi2;…;pn,oin)

(i=1,2,…,m)

决策就是要对这m个事态体进行排序。 由第一节中的性质2.3知,存在简单事态体T’,使得

Ti’=(pi’,o*;1-pi’,o0

)~Ti

问题又化为对这m个简单事态体Ti’进行排序。第22页,共59页,2023年,2月20日,星期一§2.2

效用函数的定义和构造

Ti’=(pi’,o*;1-pi’,o0

)~Ti

注意到这m个简单事态体Ti’具有相同的结果值o*、o0

,根据定义2.3,其优劣关系可以由比较pi’的大小决定。 根据性质2.3qjj是结果值oij关于o*与o0的无差异概率。其中: o*≽o0≼第23页,共59页,2023年,2月20日,星期一§2.2

效用函数的定义和构造2.2.1效用和效用函数的概念效用的概念定义2.5

设决策问题的各可行方案有多种可能的结果值o,依据决策者的主观愿望和价值倾向,每个结果值对决策者均有不同的价值和作用。反映结果值o对决策者的价值和作用大小的量值称为效用。第24页,共59页,2023年,2月20日,星期一§2.2

效用函数的定义和构造2.2.1效用和效用函数的概念效用函数的概念定义2.6 若在事态体集合Ŧ上存在实值函数u,有:(1)对任意的T1、T2∈Ŧ,T1T2当且仅当u(T1)>u(T2)(2)对任意的T1、T2∈Ŧ,且0≤λ≤1,有u[λT1+(1-λ)T2]=λu(T1)+(1-λ)u(T2) 则称u(T)为定义在Ŧ上的效用函数。第25页,共59页,2023年,2月20日,星期一2.2.1效用和效用函数的概念估计效用函数的方法(1)标准效用测定法(概率当量法,V-M法)思路:对于给定的结果值,测定其效用值。 设有决策系统(Ω,A,F),其结果值集合为: O=(o1,o2,…,on)记: o*≽max{o1,o2,…,on} o0≼min{o1,o2,…,on}

对于每一个结果值oj都存在一个概率值pj,使得 oj~(pj,o*;1-pj,o0)

pj就可以作为结果值oj的效用值。第26页,共59页,2023年,2月20日,星期一2.2.1效用和效用函数的概念(1)标准效用测定法(概率当量法,V-M法)步骤①设u(o*)=1,u(o0)=0;②建立简单事态体(x,o*;1-x,o0),其中x称为可调概率;③通过反复提问,不断改变可调概率值x,让决策者权衡比较,直至当x=pj时

oj~(pj,o*;1-pj,o0)④测得结果值oj的效用

u(oj)=pj=pju(o*)+(1-pj)u(o0)第27页,共59页,2023年,2月20日,星期一2.2.1效用和效用函数的概念估计效用函数的方法(2)确定当量法(修正的V-M法)思路:对于给定的效用值,测定其结果值。步骤①设u(o*)=1,u(o0)=0;②对于给定的效用值pj,构造简单事态体 (pj,o*;1-pj,o0)③通过反复提问,不断改变结果值oξ

,让决策者权衡比较,直至当oξ=oj时

oj~(pj,o*;1-pj,o0)④得效用值pj对应的结果值为oj,即u(oj)=pj。第28页,共59页,2023年,2月20日,星期一2.2.2效用函数的构造 介绍一种实用的效用函数的构造方法。基本思路

对于决策问题的结果值集合,先用确定当量法找出一个基准效用值,即效用值等于0.5的结果值,称为确定当量oξ。其余效用值不再测定,而是按比例用线性内插的方法,用同一个标准计算得到。第29页,共59页,2023年,2月20日,星期一2.2.2效用函数的构造方法 设决策问题结果值集合为: O=(o1,o2,…,on)①取

o*≽max{o1,o2,…,on} o0≼min{o1,o2,…,on}

并令u(o*)=1,u(o0)=0;②构造简单事态体(0.5,o*;0.5,o0),用确定当量法找到该事态体的确定当量oξ,使得: oξ~(0.5,o*;0.5,o0)第30页,共59页,2023年,2月20日,星期一2.2.2效用函数的构造方法③对结果值进行归一化处理,记归一化的结果值为x(oj)

则:x*=x(o*)=1,x0=x(o0)=0,0≤x(oj)≤1④记确定当量oξ的归一化值为ε,也记为x0.5第31页,共59页,2023年,2月20日,星期一得到经归一化变换后的效用曲线上的三个点: (0,0),(ε,0.5),(1,1)ux011ε0.5第32页,共59页,2023年,2月20日,星期一2.2.2效用函数的构造方法⑤在新区间[0,ε]和[ε,1]按同样方法插入点(x0.25,0.25)和(x0.75,0.75),保持比例关系计算得:第33页,共59页,2023年,2月20日,星期一效用曲线上新增两个点: (ε2,0.25),(2ε-ε2,0.75)ux011ε0.50.25ε20.752ε-ε2第34页,共59页,2023年,2月20日,星期一⑥若认为点数太少,效用曲线不够精确,可继续按同样方法在新产生的区间内插入效用中点,直到产生足够的点为止。若在效用区间[0,1]中插入2n个分点:记相应的归一化的结果值为△k,有:第35页,共59页,2023年,2月20日,星期一2.2.3效用与风险的关系在风险型或不确定型决策问题中,决策者选择方案几乎都要承担一定的风险,不同的决策者对风险的态度是有区别的。效用表示了决策者对决策方案各结果值的偏好程度,也反映了不同类型的决策者对风险的不同态度。因此从不同类型的效用函数可以看出决策者对风险的不同态度。第36页,共59页,2023年,2月20日,星期一2.2.3效用与风险的关系中立型效用函数

设有效用函数u=u(x),若对xl<x2,有则称该效用函数为中立型。其效用曲线是一条直线。中立型效用函数的效用值和结果值成正比例,因此可以用结果值直接评选方案。第37页,共59页,2023年,2月20日,星期一2.2.3效用与风险的关系保守型效用函数

设有效用函数u=u(x),若对xl<x2,有则称该效用函数为保守型。其效用曲线是一条上凸曲线,表示效用值随结果值的增加而增加,但增加的速度逐渐由快至慢。反映了决策者随结果值增加越来越谨慎,对风险持厌恶态度。第38页,共59页,2023年,2月20日,星期一2.2.3效用与风险的关系冒进型效用函数

设有效用函数u=u(x),若对xl<x2,有则称该效用函数为冒进型。其效用曲线是一条下凸曲线,表示效用值随结果值的增加而增加,且增加的速度越来越快。反映了决策者随结果值增加越来越敢于冒险追求高额回报的态度。第39页,共59页,2023年,2月20日,星期一2.2.3效用与风险的关系ux110中立型效用函数保守型效用函数冒进型效用函数第40页,共59页,2023年,2月20日,星期一2.2.3效用与风险的关系混合型效用函数 三种基本效用函数的混合,如:ux110混合型效用函数表示当x<x0时,即结果值不大时,决策者具有一定冒险精神;当x>x0时,即结果值较大时,决策者对风险转而持谨慎态度。x0第41页,共59页,2023年,2月20日,星期一2.3效用函数表一、效用函数表的构造 实际构造效用函数时,取n=6定出效用曲线上的26(64)个点,效用函数的精度已经足够。 书后附表6给出了n=6对于不同的权衡指标值ε(ε<0.5)的效用函数值。ε<0.5时,对应的是保守(上凸)型效用函数,效用函数值可直接查表。ε>0.5时,对应的是冒进(下凸)型效用函数,效用函数值无法直接查表。第42页,共59页,2023年,2月20日,星期一2.3效用函数表一、效用函数表的构造可以证明:

ε>0.5的效用曲线u(x)与ε’=1-ε的效用曲线u’(x)是关于直线u=x对称的。因此,ε>0.5的效用函数值可以按下面的方法求得:u(x)=1-u’(1-x)具体步骤见教材P62。注:查表时在给定的ε列若没有对应的x值,则找出与之相邻的两个值x1、x2,查出对应的效用值后用线性内插的方法确定u(x)。第43页,共59页,2023年,2月20日,星期一2.3效用函数表二、效用函数表的使用例2.1某企业欲投产一种新产品,有三种方案可供选择。已知市场存在三种状态:畅销、一般、滞销,三种方案在不同的市场状态下所获利润额构成以下的决策矩阵:决策者认为:oξ=4.5~(0.5,20;0.5,-5)第44页,共59页,2023年,2月20日,星期一例2.1试求该企业决策者的效用矩阵。解:o*≽max{oij}=20, o0≼min{oij}=-5

u(o*)=1, u(o0)=0将决策矩阵的结果值归一化:得归一化后的决策矩阵为:第45页,共59页,2023年,2月20日,星期一例2.1试求该企业决策者的效用矩阵。由 oξ=4.5~(0.5,20;0.5,-5)得:查P369附表6,ε=0.38所在列,以x22=0.5为例:0.490621<x22=0.5

<0.503698而 u(0.490621)=0.65625,u(0.503698)=0.671875用线性内插法:解得u(x22)=0.6675。第46页,共59页,2023年,2月20日,星期一例2.1试求该企业决策者的效用矩阵。同理得:u(x11)=0.7300,u(x12)=0.6091,

u(x13)=0.4306,u(x31)=0.8742

u(x32)=0.5596,u(x33)=0.2068且 u(x21)=u(o*)=1,u(x23)=u(o0)=0得决策者的效用矩阵为:第47页,共59页,2023年,2月20日,星期一例2.2在上例中,若决策者认为:

oξ=11.25~(0.5,20;0.5,-5)

试求该企业决策者的效用矩阵。

解:同上例方法得归一化后的决策矩阵为:第48页,共59页,2023年,2月20日,星期一例2.2

由 oξ=11.25~(0.5,20;0.5,-5)得:查P369附表6,ε’=1-0.65=0.35所在列,以x32=0.44为例,

u(x32)=1-u’(1-x32)=1-u’(0.56): 0.53689<0.56

<0.5775而 u(0.53689)=0.734375,u(0.5775)=0.75用线性内插法解得u’(0.56)=0.7433,因此:

u(x32)=1-u’(0.56)=0.2567第49页,共59页,2023年,2月20日,星期一例2.2

同理得:u(x11)=0.3819,u(x12)=0.2598,

u(x13)=0.1271,u(x22)=0.2920

u(x31)=0.5725,u(x33)=0.0251且 u(x21)=u(o*)=1,u(x23)=u(o0)=0得决策者的效用矩阵为:第50页,共59页,2023年,2月20日,星期一§2.4

效用函数的曲线拟合

前面讨论了针对特定的结果值,如何测定其效用,我们得到的只是一些离散的效用值,要得到连续的效用函数,则需要用曲线拟合的方法。常见的拟合曲线形式线性函数型

u(x)=c1+a1(x-c2) 其中c1、a1、c2为待定参数。

前面查表时用内插法确定某些效用值,实际上就相当于效用函数为分段线性函数。第51页,共59页,2023年,2月20日,星期一§2.4

效用函数的曲线拟合常见的拟合曲线形式指数函数型其中ci、ai(i=1,2,3)均为待定参数。双指数函数型指数加线性函数型第52页,共59页,2023年,2月20日,星期一§2.4

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论