运筹学-决策论_第1页
运筹学-决策论_第2页
运筹学-决策论_第3页
运筹学-决策论_第4页
运筹学-决策论_第5页
已阅读5页,还剩89页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第11章决策论TheoryofDecision11.1决策分析的基本问题11.2确定型和非确定型决策11.3风险型决策

11.4效用理论11.5马尔可夫决策

运筹学

Operations

Research

11.1决策分析的基本问题决策(DecisionMaking)是一种对已知目标和方案的选择过程,当人们已知确定需实现的目标是什么,根据一定的决策准则,在供选方案中做出决策的过程。诺贝尔奖获得者西蒙认为,管理就是决策,他认为决策是对稀有资源备选分配方案进行选择排序的过程。学者Gregory在《决策分析》中提及,决策是对决策者将采取的行动方案的选择过程。决策科学包括决策心理学、决策的数量化方法、决策评价以及决策支持系统、决策自动化等。随着计算机和信息通信技术的发展,决策分析的研究也得到极大的促进,随之产生了计算机辅助决策支持系统(DecisionSupportSystem),许多问题在计算机的帮助下得以解决,在一定程度上代替了人们对一些常见问题的决策分析过程。11.1决策分析的基本问题11.1.1决策分析基本概念决策狭义决策认为决策就是作决定,单纯强调最终结果;广义决策认为将管理过程的行为都纳入决策范畴,决策贯穿于整个管理过程中。决策目标决策者希望达到的状态,工作努力的目的。一般而言,在管理决策中决策者追求的当然是利益最大化。决策准则决策判断的标准,备选方案的有效性度量。决策属性决策方案的性能、质量参数、特征和约束,如技术指标、重量、年龄、声誉等,用于评价它达到目标的程度和水平。科学决策过程任何科学决策的形成都必须执行科学的决策程序,如图11-1所示。决策最忌讳的就是决策者拍脑袋决策,只有经历过图11-1所示的“预决策→决策→决策后”三个阶段,才有可能产生科学的决策11.1决策分析的基本问题11.1决策分析的基本问题调查研究确定决策目标搜集有关的信息资料预测技术预测未来的可能情况拟订各种可行方案可行性研究方案评估决策准则方案选择方案实施预决策决策实施情况反馈意见决策后图11-1科学决策过程11.1决策分析的基本问题决策系统状态空间、策略空间、损益函数构成了决策系统。①状态空间不以人的意志为转移的客观因素,设一个状态为Si,有m种不同状态,其集合记为:S称状态空间,S的元素Si称为状态变量。②策略空间人们根据不同的客观情况,可能做出主观的选择,记一种策略方案为Ui,有n种不同的策略,其集合为:U称为策略空间;U的元素Uj称为决策变量。③损益函数当状态处在Si情况下,人们做出Uj决策,从而产生的损益值Vij,显然Vij是Si,Uj的函数,即:11.1决策分析的基本问题当状态变量是离散型变量时,损益值构成的矩阵叫损益矩阵上述三个主要素组成了决策系统,决策系统可以表示为三个主要素的函数:D=D(S,U,V)人们将根据不同的判断标准原则,求得实现系统目标的最优(或满意)决策方案。11.1决策分析的基本问题11.1.2决策分析基本原则1.最优化(满意)原则2.系统原则3.可行性原则4.信息对称、准全原则11.1.3决策分析基本分类表11-1按影响范围战略决策、战役决策、战术决策按状态空间确定型决策、非确定型决策、风险型决策按决策时间程序化决策、半程序化决策、非程序化决策按描述方法定性化决策、定量化决策按目标数量单目标决策、多目标决策按连续性单级决策、序贯决策按决策者数量个人决策、群决策按问题大小宏观决策、微观决策表11-2程序化、非程序化、半程序化决策决策类型传统方法现代方法程序化现有的规章制度运筹学、管理信息系统(MIS)半程序化经验、直觉灰色系统、模糊数学等方法非程序化经验、应急创新能力人工智能、风险应变能力培训11.1决策分析的基本问题下一节:确定型和非确定型决策11.1决策分析的基本问题11.2确定型和非确定型决策11.2确定型和非确定型决策11.2.1确定型决策确定型决策是指决策的未来状态是已知的,只需从备选的决策方案中,挑选出最优方案。【例11.1】某企业根据市场需要,需添置一台数控机床,可采用的方式有三种:甲方案:引进外国进口设备,固定成本1000万元,产品每件可变成本为12元;乙方案:用较高级的国产设备,固定成本800万元,产品每件可变成本为15元;丙方案:用一般国产设备,固定成本600万元,产品每件可变成本为20元;试确定在不同生产规模情况下的购置机床的最优方案。【解】此题为确定型决策.利用经济学知识,选取最优决策.最优决策也就是在不同生产规模条件下,选择总成本较低的方案.各方案的总成本线如图11.2.图11.2TC甲=F甲+Cv甲Q=1000+12QTC乙=F乙+Cv乙Q=800+15QTC丙=F丙+Cv丙Q=600+20Q图中出现了A、B、C三个交点,其中A点经济意义:在A点采用甲方案与丙方案成本相同TC甲=TC丙,F甲+Cv甲QA=F丙+Cv丙QA

Q=5011.2确定型和非确定型决策同理:B点TC乙=TC丙,F乙+Cv乙QB=F丙+Cv丙QB

C点:TCL甲=TC乙,F甲+Cv甲QC=F乙+Cv乙QC

B点经济意义为:当生产40万件时,采用乙方案和采用丙方案成本相同均为1400万元.图11.211.2确定型和非确定型决策得到生产规模最优方案为:当生产规模产量小于40万件时,采用丙方案;当生产规模产量大于40万件,小于200/3万件时,采用乙方案;当生产规模产量大于200/3万件时,采用甲方案.其经济意义为:当生产规模为万件时,采用甲、乙方案成本相同.从图中可知:当生产规模≤QB时,采用丙方案;当QB<生产规模≤QC时,采用乙方案;当QC<生产规模时,采用甲方案.图11.211.2确定型和非确定型决策11颜.2毛.2非确证定型映决策(1)状钩态空商间侦是指维不以刘人的职意志证为转饶移的士客观亿因素臂,设偏一个岭状态是为Si,有m种不烛同状膏态,吃其集州合记般为:S称状榆态空炎间;S的元王素Si称为望状态炎变量马.由于威在非陆确定睡决策插中,制各种捷决策聪环境版是不州确定贝的,急所以挽对于弦同一爆个决艳策问政题,悼用不甩同的宽方法胀求值零,将营会得款到不喊同的翻结论移,在舒现实月生活床中,持同一皆个决道策问辰题,名决策零者的歪偏好凯不同挖,也原会使访得处雁理相比同问温题的沙原则蛇方法眨不同饥.(2)策每略空内间照是指买人们秀根据刊不同刮的客吵观情柱况,衬可能云做出衣主观硬的选高择,给记一匠种策蛇略方溪案为Ui,有n种不驴同的钞策略报,其浮集合11野.2确定席型和缘瑞非确辣定型滚决策U称为木策略凯空间歇;U的元说素Uj称为副决策然变量捏.(3)损热益函区数茶是抚指当亿状态宁处在Si情况铸下,枝人们氧做出Uj决策殊,从年而产钞生的震损益预值Vij,显然Vij是Si、Uj的函刻数,抚即当状兼态变绪量是歉离散鲜型变屑量时牧,损忌益值交构成瞒的矩示阵叫论损益芦矩阵猫.11色.2确定指型和吊非确昌定型帽决策或简懂记为上述崭三个馅主要挪素组却成了抗决策呆系统裹,决滥策系喝统可矮以表哲示为置三个魄主要罗素的立函数刊:D=D(S,U,V)常用授的非龄确定滥型准把则有5种:1.悲观裂准则2.乐观草准则3.折衷镰法、副实用诱主义铲准则4.等可熔能性挠准则5.最小仓机会论损失袄(后玻悔)慌准则11梳.2确定棒型和划非确灿定型购决策【例11狗.2感】某公辜司为法经营煮业务须的需鸦要,郑决定优要在抛现有辞生产体条件叙不变递的情蜡况下寒,生境产一棚种新察产品此,现过可供胸开发辈生产济的产贺品有I、朱II雾、I侍II旬、I足V四种狮不同对产品预,对贤应的求方案头为A1,A2,A3,A4.由于走缺乏虫相关底资料伞背景须,对馆产品续的市笨场需拖求只促能估下计为糠大中胖小三描种状少态,过而且厕对于零每种圆状态西出现粗的概耕率无肺法预冒测,码每种勉方案虎在各但种自鄙然状栗态下你的效辛益值梨表,退如表11怎.3所示五.表11努.3效益役值表(单位度:万橡元)自然状态供选方案Ai需求量大S1需求量中S2需求量小S3A1:生产产品I800320-250A2:生产产品II600300-200A3:生产产品III30015050A4:生产产品IV40025010011汽.2确定采型和编非确增定型锻决策(1)小袖中取朽大法想(悲秒观主阳义准浓则ma伙xm押in)则对陕应的A4方案面为决火策方腔案,龙即生贝产产赴品IV帜.自然状态供选方案Ai需求量大S1需求量中S2需求量小S3minmax生产产品I800320-250-250生产产品II600300-200-200生产产品III3001505050生产产品IV400250100100100策略遵值为11详.2确定怖型和可非确锋定型拘决策(2哭)大中湖取大欺法(乐观途主义垃准则ma软xm阿ax)则对阶应的A1方案拳为决夜策方牛案,渗即生俘产产陡品I.自然状态供选方案Ai需求量大S1需求量中S2需求量小S3maxmax生产产品I800320-250800800生产产品II600300-200600生产产品III30015050300生产产品IV400250100400策略鲜值为11勿.2确定屑型和疮非确鲜定型趁决策(3)最小走机会碍损失愁准则(Mi敌ni方ma扑xre群gr装etcr臂it棉er鞭io增n)编制讲机会围损失淹表:找出指每个抄方案稍的最联大机清会损惑失Zi:选择绍最小毅的机付会损扯失值:对应括的方麦案l即为文所决饭策方村案

自然状态

生产方案需求量大S1需求量中S2需求量小S3Maximum决策结果A1:生产产品I00350350

A2:生产产品II20020300300生产产品IIA3:生产产品III50017050500

A4:生产产品IV400700400

则应跃选对胞应的A2方案粘为决脸策方廉案,柏即生倘产产剪品Ⅱ11伞.2确定腊型和游非确月定型俘决策策略巧值为(4)等饥可能梅性决乱策准淹则(Eq锁ua嚼l图li谦ke桶li争ho酷od穴c爸ri答te这ri通on饭)自然状态供选方案Ai需求量大S1需求量中S2需求量小S3E(Ai)max生产产品I800320-250290290生产产品II600300-200700/3生产产品III30015050500/3生产产品IV400250100250则应眉选择膨对应乱的A1方案抢为决羡策方循案,姿即生疮产产熟品I11栋.2确定箱型和枝非确吗定型驻决策(5辞)折衷础法,最现实押主义狮准则(Hu听rw衫ic故zcr德it咏er蓬io挺n)ma善x滴mi早n法是处当=0时状孔态,ma欠x屈ma谋x是=1时状惭态.原则:决策者给出乐观系数则说明决策者越接近悲观;则说明决策者越接近乐观.

自然状态

0.30.7

生产方案需求量大S1需求量中S2需求量小S3MaxMin加权平均决策结果A1:生产产品I800320-250800-25065

A2:生产产品II600300-200600-20040

A3:生产产品III3001505030050125

A4:生产产品IV400250100400100190生产产品IV则应桥选择乘对应待的决乒策方码案A4吗,即生搅产产尿品IV塞。11砖.2确定国型和再非确写定型模决策下一驱节:戴风险子型决注策11足.2确定弊型和晋非确搅定型炒决策作业暮:教值材P2斥68腐T辫1、211厉.3风险期型决堪策11煎.3风险免型决中策风险垮型决朽策是钻指每丘种自停然状腥态出削现的应概率则大体艰可以湾估计摸,并仍可算嘉出在吼不同炮状态拔下的单效益哈值.11扫.3鼓.1期望璃值准计则(Ex桂pe炕ct成ed振v蔑al疼ue外c讨ri府te绑ri运on疗)求效熔益期色望值EM悦V。效益凤期望垫值=∑条件混效益开值×概率辞,即选择合最大挠效益轨期望陶值所修对应疮的方托案为宏决策荣方案1.最大概效益拘期望归值准互则11杯.3风险辟型决旋策【例11林.3查】某电仗讯公好司决场定开瞎发新膝产品鼻,需恨要对民产品慕品种旋做出某决策造,有然三种档产品A1,A2,A3可供离生产遣开发茅。未墙来市仔场对宁产品庙需求卫情况向有三欣种,希即较浇大、石中等经、较涛小,停经估替计各溉种方沙案在怪各种孩自然叙状态莫下的停效益敢值,孙见表11-5.各悲种自侦然状按态发透生的蒜概率草分别边为0.辽3,0.系4和0.祖3.那艇么工慎厂应始生产毁哪种孤产品竞,才酿能使斩其收盗益最孤大歌。表11-5效益咬表(单位唯:万壁元)方案需求量较大p1=0.3需求量中等p2=0.4需求量较小p3=0.3A15020-20A23025-10A310101011搏.3风险因型决粪策【解加】效益动的期医望值你表如蔽下

自然状态

期望

生产方案需求量大S1需求量中S2需求量小S3收益决策A1:生产产品I5020-2017生产产品IA2:生产产品II3025-1016

A3:生产产品III10101010

状态概率0.30.40.3

因此复选择详相应榴方案好,即紫开发A1产品凯。求每循个方蛋案的交期望徒后悔筝值,奋最小笨期望杰后悔馆值对姻应的卸方案驾即为辱所选况方案幸。求亏解过顺程留臭给同军学们霞作练张习。除了影前面7种决臂策准闯则外舍,还乳有完逝全信快息期肢望值疗准则(EV炭PI竖:E辰xp烛ec傍te嗓dva参lu述e切of演p协er窝fe调ct梅i元nf辫or前ma袋ti收on塔)样本闸信息具期望爹值准捞则Ex蚂pe祝ct均ed祥v街al偷ue针o嫌f否sa略mp萝le妻i茧nf峡or缴ma猴ti积on砖(落EV写SI夹)完全补信息膜后悔筒值期座望值旅准则Ex凳pe辩ct孟ed叛r态eg争re诱t饼va遥lu熔e屑of销p尚er财fe朝ct眠i泛nf俊or探ma侍ti独on2最小同期望亿后悔价值准雅则(Ex息pe印ct宾ed达r指eg旧re赞t阻va臭lu听e)11保.3风险检型决凡策11认.3风险盗型决眨策11即.3块.2决策愧树法腥(De报ci然si毫on仗T液re沟e)决策参树是胆由决生策点茄、事款件点做及结盟果构昏成的魔树形举图,恶一般氏应用爽于序授列决铁策中复。□:表示痛决策示点,椒也称芝为树贤根,沫由它漫引发梦的分部枝称暖之为筹方案扇分枝泊,方上案节肠点被岂称为滋树枝猴.n条分姐枝表潜示有n种供系选方脱案.〇:表示辈策略睡点,携其上碑方数赖字表惰示该桑方案扯的最拒优收若益期夜望值医,由忌其引岗出的m条线越称为罢概率射枝表锋示有m种自超然状乐态,茅其发迅生的泼概率织已标液明在姥分枝饮上.△:表忘示每闲个方裳案在瞧相应汇自然损状态寻的效论益值幻玉.╫:恋表示保经过滋比较麦选择窜此方草案被掌删除剂掉了污,称塌之为裁剪枝抢.方法扇:①根据纺题意券作出伟决策剃树图可;②从右疼向左度计算险各方渐案期格望值嗽,并饺进行蛾标注是;③对期扫望值疯进行遥比较院,选哗出最跳大效康益期副望值炊,写蚁在□上方赴,表比明其慨所对炒应方呈案为与决策驳方案富,同肉时在械其它肠方案模上打练上╫删除攻.HH1HiHmE(曾H1)E(谦Hi)E(族Hm)V11V1jV1nVi1VijVinVm1VmjVmnpjpnp1pjpnp1pjpn图14-3决策匀树图ma雀x{汪E(共Hi)}11穿.3风险负型决再策【例挠11漫.4嫁】某厂仙决定示生产虾某产樱品,寸要对妻机器撑进行窄改造编.投婚入不擦同数蜓额的慢资金蜂进行拉改造股有三蛋种方互法,筛分别匆为购还新机按器、限大修矛和维唤护,渴根据努经验,销路怕好发述生的嘉概率刘为0.退6.相景关投丙入额端及不渐同销峰路情隆况下杨的效稼益值豆如表11疾.6所示尿,请掘选择脾最佳扫方案趋.表11演.6效益曲值表(单位弹:万爬元)供选方案投资额Ti销路好p1=0.6销路不好p2=0.4A1:购新1225-20A2:大修820-12A3:维护515-811卡.3风险浴型决僵策供选方案投资额Ti销路好p1=0.6销路不好p2=0.4A1:购新1225-20A2:大修820-12A3:维护515-8解①根据阿题意哥,作森出决肯策树撇,见私图11-4.②计算滥各方津案的酿效益晓期望持值:③最大披值为选对预应方哄案A3,即维商护机恰器,嗓并将A1,A2剪枝册.11动.3风险沸型决稠策供选方案投资额Ti销路好p1=0.6销路不好p2=0.4期望值A1:购新1225-20-5A2:大修820-12-0.8A3:维护515-80.8A0.旱8A1A2A3-5-0杨.80.晒825好0.坛6-2继020-1215-8不好0.粗4图14-4决策阁树图好0.兆6不好0.筑4好0.杆6不好0.蜂4购新大修维护11喊.3风险买型决虚策多级床决策耐问题【例11衡.5勺】某公裳司由芝于市催场需林求增勺加,桨使得同公司搂决定翻要扩讨大公旨司规返模,基供选点方案众有三寇种:坑第一崇种方扶案,恨新建谎一个收大工但厂,松需投丽资25悉0万元长;第早二种低方案勿,新等建一扭个小肚工厂窗,需扁投资15定0万元昼;第夕三种震方案描,新群建一湖个小赵工厂偷,2年后薪若产谦品销躬路好锁再考分虑扩最建,肤扩建傻需追无加12变0万元跑,后3年收央益与劈燕新建拥大工扰厂间恐.如表11舅.7所示祸,根泻据预挺测该壁产品惧前三厉年畅鸡销和寺滞销絮的概撑率分浊别为0.垃6,0.伏4.若粉前2年畅阶销,堂则后3年畅务销后唱滞销右概率封为0.饿8,0.悉2;若税前2年滞逢销,估则后3年一映定滞嫩销.摸请对突方案招做出决选择猫.11狐.3风险扭型决迹策表11乖.7效益越值(单位躺:万防元)自然状态概率供选方案与效益前2年后3年大工厂小工厂先小后大前2年后3年畅销0.6畅销0.8滞销0.21508080150滞销0.4畅销0滞销1-502020-50成本250150150120解拥(1)画狐决策付树11边.3风险智型决仔策畅销0.牙815委0滞销0.咏2-5熟0533陪06-1富50滞销1-5融0228畅销0.距6滞销0.辆4畅销0.答880滞销0.殖220720谨4860滞销120310术8.取4畅销0.驳6滞销0.未4畅销0.那815虽0滞销0.久2-5井021预01220亏41121杠0扩建不扩背建9畅销0.罗8滞销0.劫2802041020滞销1畅销0.辩6滞销0.张460后3年前2年111往2大工境厂小工债厂先小妇后大11庄2图11-11决策衫树图解盗(1)画倚决策乱树12掀015弓015桶025完0比较荒方案,E(寻4)最大厦,则著取最模大值11牺2,对笔应的单方案匀是先膜小后糠大作疗为选稿定方腰案,朵即先希建小床厂,馒后扩荐建大股工厂惠的方剖案为喜最终径方案11枣.3风险脸型决垄策11侄.3粉.3贝叶五斯决筋策Ba遇ye友si规an庆D滴ec跪is和io骗n开始者人们咱对原趣来的干状态邪参数死提出芹某一程概率华分布筋。后你来通肢过调孙查又啦获得郊许多企信息柏,只鲜要原暮来信车息不诵是错叙误的籍,则把应该交用后嘱来的比补充燃信息很修正冒原来泛的认代识。渔用补垄充的俱情报底改进届原来编的概煌率分蓝布。将依帽据过誓去的爽信息尤或经偿验由密决策次者估芦计的剥概率显称之跳为主刷观概复率.未收丘到新公信息耽时根玩据已际有信姑息和森经验畏,估养计出即的概菠率分吉布称当为先验辫概率;用随债机试潮验确劲定出案的概千率称仿为客观总概率.收到搁新信填息,修正陡后的垃概率丝式分布代称为后验放概率事件B已经扯发生膨的条番件下侨,事闭件A发生抗的概某率,智称为页事件A在给剩定B下的条件琴概率贝叶盟斯公陵式:若A1、A2、…构成街一个婆完备交事件天,P(Ai)>翁0,则对颗任何气概率托不为掉零的眠事件B,有11肥.3风险撞型决苏策更一般诊地此公式高为后食验概荐率11元.3风险虏型决燃策产品需求量x0100200300400先验概率p(xi)0.050.150.30.250.25例如捧,根页据以盾往的拘经验刻,产忙品需冈求量峰的概杀率为产品连进入泛市场2个月满的试州销后芽,需领求量胁的样黎本信草息(比例)为产品需求量0100200300400需求量比例0.050.150.350.250.20贝叶须斯公方式:若A1、A2、…构成亦一个友完备矮事件绑,P(Ai)>铃0,则对债任何阔概率搜不为裕零的味事件B,有11么.3风险铺型决慕策【例】盒子桃里有10桥0枚均钢匀的配硬币郊,有60枚是五正常哥的,40枚两辩面都四是徽煮。从侨盒子晕中任侧取一蔑枚让陆你猜鞋是哪剖一类壁硬币期。猜冈中得5元,或猜不托中不台得钱莲。你摘猜是假哪一脊类?B1(正常)B1(双徽)3/52/5A1(猜正常)50A2(猜双徽)05获利懒的期叫望值V(保A1)=盼5×谦3/研5+烧0×翁2/纪5=叉3V(缓A2)=谨0×优3/忙5+颤5×猾2/董5=劫2正确专的决悠策是串:应钞该选猪择猜龟正常11移.3风险护型决托策如果搜现在涉抛掷3次,3次都急出现锯徽,述你又鱼如何漏猜?骂该硬抖币是挑正常匙的概宿率为施多少刊,是器双徽柳的概怪率为蚊多少慌。设H为3次出温现反高面这玩一随诵机事专件,B1为硬台币是稠正常长,B2为硬议币是命双徽估,则3次撒都出现抱双徽沿的概樱率为摘:11稻.3风险惠型决著策B1(正常)B1(双徽)3/1916/19A1(猜正常)50A2(猜双徽)05用后验盖概率掘代替委原来炸的概满率,位决策后矩阵堵为:获利协的期按望值V(裂A1)=置5×暴3/注19兵+0扭×2籍/5拐=1浊5/毫19V(烈A2)=鄙0×舌3/睁5+姜5×夫16度/1己9=舒80黎/1饭9正确锈的决严策是愚:应榜该选淘择猜熟双徽11扰.3风险纷型决抗策根据楼过去读经验小可知表当自漆然状液态为Nj条件症下调角查结爪果为Zk的条怒件概执率再利储用贝夺叶斯桶公式纲和全区概率巧公式纠,求鹅当结凤果为ZK的条爸件下到自然愁状态睛为Nj的条擦件概权率11沙.3风险耽型决浸策在后敌验分滥析中淋用代替桌先验极分析禁中的P(Nj),利用仔期望售值准坝则计添算出Ek再根任据全虑概率斤公式替,可耗知结挥果为Zk的概恨率为因此窑,后酱验分悟析的姑效益何期望躬值为11错.3风险奋型决爸策当状肢态只拢有两旦个时饥,后惠验概述率及邻期望粉收益群可用功快捷色公式驰计算终。记圣先验睡概率猫向量邻为P,条件月概率钞矩阵减为A,后验疮概率甘矩阵帖为B,收益柄矩阵谅为V,有则先因验收挎益期雷望值元向量情为EM旷V1=PTV后验棵收益哀期望灭值矩貌阵为Ek=BV11餐.3风险桥型决聚策【例11齐.6锐】某厂江对一舍台机罢器的想换代仪问题洞做决扭策,宏有三营种方宣案:A1为买译另一敞台新茅机器鲁;A2为对刊老机基器进乳行改细建;A3是维解护加台强.珍输入盾不同近质量咬的原吹料,炎三种哭方案耀的收策益见免表11狐.8.约铸有30番%的原虽料是凯质量播好的改,还胸可以坛花60瓜0元对显原料绣的质梨量进日行测污试,役这种片测试抚可靠哲性见兄表11布.9.求华最优穷方案就.11洪.3风险错型决命策原料的实际质量N1好N2差测试结果Z1好0.80.3Z2差0.20.7原料质量Ni购新机器A1改建老机器A2维护老机器A3N1好(0.3)31.00.8N2差(0.7)-1.50.50.6表11头.9测试舱可靠眨性表11婶.8收益望表(单位坦:万活元)11暑.3风险尼型决见策【解】(1)若蹄不做东测试己,各膝方案府的先挎验收野益应选驻方案3,维沟护老艺机器住。(2劝)计算桂后验盈概率已知联合炒概率难为:11眼.3风险信型决幻玉策边际粒概率竹为代入钢(11敌.2)从惕而可膏得后亲验概均率11宝.3风险相型决蛾策则有即当穗测试胀结果菌为原龙料的著质量历好,壳则购块买新逼机器台;若磁测试捕结果绪为原绒材料掘的质策量差尾,则商维护桌老机认器。决策涌为:钥应花60亮0元进拍行测腾试,初测试祥后若摊质量宪好,颠购入秧新机购器生扭产;扑若质拆量差上,维巴护老怜机器艺生产【例】石油帮开发面决策巾问题收益勘探-250钻探-150卖出收益90有油时收益800干涸时收益011巴.3风险位型决惨策11陶.3风险搭型决舱策自然状态先验概率好(FSS)不好(USS)有油(Oil)P(O)=0.6P(F|O)=0.8P(U|O)=0.2干涸(Dry)P(D)=0.4P(F|D)=0P(U|D)=1P(嘴Fi羽nd乱in僚g勘探到结果|St锅at趁e自然割状态)后验概率P(自然状态|勘探结果)勘探结果边际概率有油(Oil)干涸(Dry)好(F)不好(U)勘探世好的狗概率饶:P(难F)端=P废(O够)*单P(兵F|质O)胖+P粒(D刃)*债P(寒F|支D)=0悠.6削×0陈.8辣+0激.4总×0由=0制.4掌8勘探撑好的湖概率吐:P(宫U)货=P印(O傻)*芒P(糕U|需O)斯+P扬(D舅)*让P(播U|密D)=0寒.6怪×0测.2微+0缴.4松×1帜=0圈.5替2勘探闪好时绣有油培的概千率P(料O|低F)狠=巧P(耗O)营*P邻(F听|O浅)糠/[睁P(刺O)胡*P冰(F宝|O筋)+住P(你D)冈*P目(F湖|D柴)]=0巨.6树×0丹.8览/0拼.4败8=断1勘探铜好时灯干涸洽的概稼率P(最D|虾F)肝=溉P(扎D)叔*P雁(F殖|D勿)需/[收P(袄O)导*P革(F软|O秆)+贫P(杰D)汪*P墙(F单|D谎)]=0即.4呆×0仆/0揪.4窝8=恰0勘探会不好杆时有傲油的蛮概率P(屋O|戚U)参=并P(百O)额*P战(U绵|O棵)哈/[现P(翅O)挠*P已(U预|O陶)+亿P(有D)门*P声(U翠|D演)]=0朗.6搞×0氧.2受/0车.5吉2=响0.败20惨37勘探再不好厅时干症涸的傍概率P(占D|妇U)药=币P(户D)鞭*P絮(U明|D男)刷/[紧P(殖O)衡*P棕(U销|O亦)+计P(肾D)述*P孕(U青|D汪)]=0咬.4借×1暂/0叮.5更2=忆0.跃76坊920.趟480.暴5210.款23弓07靠6900.宜76劣92犯31决策槐树参直看文拉件:DA倚TA壤\c个hp斑t1竭1\弟ch令11稼.x输ls下一坟节:沿效用若理论作业小:教倾材P2酬69床T琴3~711毫.3风险锹型决拳策11奥.4效用偿理论Ut绳il仙it部y颂T新he获or驴y11狠.4死.1效用贝努愁利(D.音Be访rn裂eu压ll在i)首次签提出录效用潮概念俭,他捐用图11艰.7表示务出人屑们对宾钱财蒸的真倾实价底值的岔考虑蕉与其临钱财先拥有南量之刘间有车对数饥关系声.效用讲是一符种相耳对的壤指标鸡值,票它的拆大小誓表示砍决策巡寿者对集于风众险的或态度晴,对滴某事猜物的束倾向遭、偏才差等溉主观演因素赔的强槐弱程呆度用团于量固度决兽策者盯对于派风险惹的态舞度.效用U货币M图11-7贝努框利效恰用曲斩线11糊.4效用朴理论Ut仗il晋it中y佩T貌he密or芹y【例】(1)方蒸案A1;稳获10记0元。姓方案B1:用抛越掷硬穴币的霜方法猜,猜飞对得25拐0元,笨猜错不不得击钱。(2)方崇案A2;稳获10类0元。姥方案B2:用抛某掷硬最币的梢方法叼,直絮到出碍现正驰面为耻止,今第n次出悔现正塔面得希到2n元。大多翅数选赠择A1、A2.通过版计算末有E(皂B1)>删E(录A1),块E拨(B2)>煌E(嗓A2)一般纸来说酷效用昂值在[0烦,1秧]之间老取值.凡是打决策牙者最石看好拴、最伪倾向议、最框愿意启的事庆物(足事件口)的狐效用届值可减取1;反冰之,获效用援值取0.当密各方磨案期际望值霸相同葡时,趴一般母用最怜大效厉用值译决策土准则爱,选杏择效课用值岁最大纪的方弃案.11迎.4效用报理论Ut书il锋it国y井T纯he丈or姨y通过香效用猛指标常将某逗些难需于量坏化、此有质尊的区宵别的半事件诸给予单量化费,得采到各钉方案泰的综眠合效目用值撇,选助择效春用值绪最大捎的方百案作葛为决备策准络则。11粗.4沟.2效用拼曲线确定为效用弃曲线脱的基芳本方塔法有惊两种百:一协种是中直接提问唐法,需愁要决橡策者敲回答描提问纳,主要观衡绒量.低应用富较少丽;第股二种渣是对比恭提问间法,此隶法使晌用较厅多.设现垄有A0,A1两种限方案看供选拉.A0表示袖决策损者不每需要铁花费遮任何仅风险他可获拼益x0;而A1有两掉种自蓄然状症态,四可以汤概率P获得扬收益x1,以概散率(1-P)获得各收益x2;且x1>x0>x2.令yi表示巾效益xi的效铜用值滑.则x0,x1,x2的效这用值患分别唯表示绑为y0,y1,y2.若在灭某条梳件下丛,决裂策者翅认为A0,A1两方湾案等星价,型则有界:11廉.4效用低理论Ut瞧il钉it博y执T动he守or奋y4个数p,x0,x1,x2中给定3个,筋提问吴第4个变渣量由暑决策篮者确证定,碗求出难效用貌值。一般挺采用颜改进V-西M(富Vo宏n研Ne桐um最an签n-量Mo敲rg睡en稿st驶er和n)方法货,固晃定P=0跨.5龙,x1,x2改变x0三次发,得银出相游应的y的值拜,确鞭定三印点,罗作出速效用痕曲线雅.11缠.4效用息理论Ut茧il税it杆y律T葵he么or践y【例11湾.7攻】x1=-六10鼠0,x2=4董00亡,取y(x1)=缺0,y(x2)=斜1-1疲0040坑0第一摧次提肥问:x0为何朗值时躁,上窑式成芬立?巴答:制“0”y(0欢)=史0.毕5×费0+饮0.伐5×价1=奇0.阿51(0罚,0寺.5瓜)第二深次提僚问:x0为何却值时讨,上牺式成碗立?轰答:白“20梯0”y(2轧00飘)=屈0.夹5×以y(蛇0)葛+0禁.5肺×1=约0.姑5×剃0.谎5+晃0.蠢5×耐1=莲0.化75第三秀次提起问:x0为何气值时址,上京式成来立?粮答:况“10造0”y(1负00担)=架0.献5×范y(活0)梢+0衔.5骑×y循(2旦00茅)=傅0.揭5×箩0.陷5+轰0.桑5×帅0.蹦75获=0此.6坡25(2秧00先,0铅.7眉5)(1朗00苹,0勇.6拌25春)10恳020榆030茄0011谋.4效用蒜理论Ut谱il李it辛y碎T浇he岁or义y不同枯决策申者对葛待风梳险态表度不樱同,价因而轨会得译到不料同形似状的察效用棚曲线巾.一舅般可挨分为奋保守健型Ⅰ、中侧间型Ⅱ、风脚险型Ⅲ,如脾下图腹.y1IIIx(Xma临x,1口)(Xmi誓n,0叠)Xma模xXmi补n011吩.4填.3效用肺曲线毁类型图中I为保固守型天,其匀特点政为:驱当收待益值深较小应时,钱效用协值增粘加较截快;啊随收虹益值霉增大贴时,鸽效用踏值增胆加速投度变分慢,坊表明统决策偏者不朽求大暖利,次谨慎醉小心臂,保抬守.图中II为中武间型漂,其慌特点主为:铲收益传值和考效用性值成仆正比妇,表巩明决申策者宣完全彻按机月遇办趣事,乌心平叮气和奸.图中II扁I为风六险型协,其祥特点慢为与I保守遵型恰犬好相兰反,格当收早益值木较小并时,钓效用凶值增登加较轻慢;舱随收黄益值泊增大博时,屯效用闻值增翻加速究度变余快,衫表明择决策物者对扭增加鼻收益倚反应暖敏感就,愿膛冒较仔大风竖险,点谋求锅大利卡,不动怕冒基险.II脸I11稍.4效用烧理论Ut释il创it阻y吩T哈he刷or抓y常用稳的效虚用函叫数:11雕.4效用亏理论Ut衣il质it误y净T险he探or篮y11雪.4咳.4效用苹值的斥应用【例11梦.8阔】若某膀决策貌问题乔的决击策树狱如下波图所读示,霜其决赶策者话的效众用期狱望值悟同时蛛附在趴效益垂期望膏值后啊,请允做出钟决策街.E(皮2)妈=0基.5北×3北00困+0软.5懒×(送-2坚00竿)=拐50E(蹦3)调=0肥.5壮×2搏00着+0欠.5积×(遍-1茂00万)=谦50根据妈最大雁效益颜期望访值准是则,愚无法吨判断西优劣紫.y2=0真.5斧×1奏+0喇.5以×0非=0刷.5趣,y3=0猫.5征×0授.9句+0轮.5巡寿×0际.3费=0爱.6解:(1)计扫算效抱益期猛望值检分别派为11休.4效用果理论Ut址il浊it席y倒T旨he航or用yA2方案绸效用董值>A1方案题效用鼻值,质因此五取A2方案孙为决尾策方陆案.绘制恳效用背曲线坚图见瓜下图残,可塔知,泽该决浙策者重偏向企于保雄守型蹄,不企求大渣利,便谨慎捉小心鸡.11学.4效用须理论Ut岔il键it茧y锻T阁he萍or乡丰y-2恰0030将01010产020劣0-1箭00yx11蚕.5马尔蚁可夫螺决策Ma妹rk好ov络D汤ec泊is埋io数n11治.5马尔恰可夫兔决策Ma滋rk没ov抬D自ec脱is鹿io侍n11酒.5者.1马尔冬可夫阿链用X(t)表示坊随机吊系统正在时适刻t的状丑态,钞状态奶序列为一坊随机敌过程笛,如旁果系颜统当押前的电转移菜概率姜只与惊当前咽的运宜行状荒态有背关,幕而与速以前注的状谅态无纲关,虑即:沿对随誓机过挨程若对鸡任意日的0<t1<t2…<tn<tn+1及ti∈T,X(tn+1)关于X(t1),徐…,X(tn)的条才件概盐率恰排好等冷于X(tn+殃1)关于X(tn)的条姐件概使率,蒜用数恼学符胡号表估示为矛:则称誉具穿有马痒尔可更夫性嘉.随次机过孙程称撕为马捞尔可旧夫过溪程。所有摘可能沈的全泻体取醋值称耀为过偿程的云状态约空间畜。若马墙氏过消程的话状态尾空间茫为非部负整巴数集E=蛙{0古,1曲,2泡,…沟},称为奴马氏眉链。花例如华,今杆天下男雨这粪一状耗态用水“0”表示鲜,不魔下雨网用“1”表示占,则糟状态均空间欣为E=印{0菠,1腿}。天气根变化摔过程棋符合励马Ma抄rk棚ov性。11猫.5花.2转移亿概率记Pij为从帐状态X(n)=i转移设到下笨一个僵状态X(n+1)虹=j的概席率,规一步递转移叼概率肉矩阵谜为11骨.5马尔殊可夫咐决策Ma森rk远ov亦D述ec歉is蜡io最n【例11军.9访】有3家电云器公品司分丘别生馆产三逐种不沸同牌守子的信空调腹。各怜自开蕉展广直告攻予势促奔销本水公司茫产品锹。各睛公司画所占岛的市叨场比往例是闻随时很间变遇化的郑。X=穗{Xn,n厉≥0什}构成疯一个迷以E=族{1荒,2孔,3知}为巴状态缩慧空间阴的Ma材rk普ov链。理假设轨在任晴一时察刻,眼公司1能留梁住它怖的1/可2的老则顾客秃,其集余的比则对落半购另买另浩两个她公司搏的产罗品;月公司2的一苍半顾说客能底留下述,其触余转未向公小司1;公绿司3有3/竖4能留托下,汽其余交流向仍公司2。Ma畏rk慨ov链的斑转移言概率皆矩阵思和转访移图陪:①②③1/钻21/拜41/错41/担21/翠21/敞43/麦411陕.5马尔虏可夫涂决策Ma波rk以ov贩D信ec煌is锐io凯n求n期后例公司i的市春场占扁有率炊,n→担∞时的市场买占有围率。记Pj(n)=P(革Xn=j感)为Ma沸rk扣ov链X时刻n处于侦状态j的概孩率,P为初挨始分明布。【定理】X=退{Xn,n惰≥0污}为一配个Ma恒rk千ov链,衡则有对任意m,鹿n≥退0,有对任意i,j∈E,有此方程阴称为Ch吧am宅pa衰n-躲Ko只lm雨og逃or马ov方程租,简童称C-娇K方程11觉.5核.3转移症状态11彩.5马尔企可夫励决策Ma殖rk样ov绍D疗ec澡is施io晋n【例11福.1圾0】假设3个公缘瑞司开满始的锻市场父占有率率为(0默.3,0.搞35,0.戒35村),求5个月知后的关市场颗占有跌率(状态)。【解】P0=安(0进.3册,0怪.3说5,撤0.都35锻)11虹.5马尔础可夫以决策Ma鲁rk颈ov披D喝ec调is晒io堪n遍历踪蝶性:具如果踪蝶一个请齐次咐的马捷尔可贺夫链{X(n),n=1房诚,2较,…阴}的n步转累移概爱率为Pij(n),对于晚一切毅状态i,j,存在乖着不密依赖绑于初础始状店态i的常傅数Pj,使得成立涉,则掉称此册马尔父可夫厘链具语有遍展历性禽.也罚就是搬说,慢一个扭具有僵遍历假性的脊马尔慎可夫宽链,捷当转瘦移的联次数n极大嫩时,舟此系疗统转驱移到弯状态j的概葬率为龟一个半常数Pj,而与醋初始喷状态咐无关擦.求【引理】设m阶矩钞阵P具有m个线受性无垒关的再特征错向量B=乏(b1,b2,文…,bm)对应倚的特壶征值稻为λ1,籍λ2,…珍,λm,则B可逆龙且有P=蹲BΛ日B-1,Pn=BΛnB-1.其中Λ=森di大ag调(λ1,悲λ2,…胸,λm)11定.5马尔母可夫条决策Ma唯rk家ov佣D办ec祥is姿io乡丰n上例卧中,刺求Pn及求转托移概何率矩亏阵P的特福征值再及特栏征向斥量。收由|λI株-P皆|=宝0得特征逆值及利特征赢向量石矩阵行为11齿.5马尔堂可夫跪决策Ma原rk振ov腔D卸ec押is疯io黎n则有11例.5马尔韵可夫蚀决策Ma滩rk渐ov奋D填ec众is摔io酒n长期树后市符场占析有率享各占1/过3由得解方程申得到顾稳定撤状态丽的概陕率G11员.5马尔腾可夫杀决策Ma各rk挠ov氧D凤ec臂is套io搂n【例11史.1贼0】设某政公司背有两开种状村态:1和2,1为盈污利,2为亏狗损.锤当其旁处于1时,膨下一摄年仍餐为1的概趁率是1/锦2,因论此下惑一年捏转为2的概蜜率也姥是1/吓2.当扇公司共处于悬状态2时,砖下一夸年经产过努庸力回此到状决态1的概渗率为2/匀5,仍施处于就亏损愧状态贴的概害率为3/醉5.若与公司常现处产于状秧态1,问锹经过n年后踩该公忽司处插于状妇态1和2的概畜率各芦是多容少?解:岩显然芽,系龟统有轻两个瓦状态湾,设S为状依态空岔间,净则:S=锻{i,见j}=皱{1拜,仔2}控.此处猴,p11=1宅/2份,p12=1同/2里,p21=2巷/5厉,p22=3谈/5惑.因此设G=毫(g1,g2),由G=亲GP11链.5马尔赶可夫隔决策Ma蹈rk断ov甜D治ec棍is泻io做n设G=涝(g1,g2),由G=朋GP11真.5马尔拢可夫立决策Ma凉rk臭ov笑D瓦ec遇is绕io出n11库.5册.4收益婶预测锤模型设系丧统在外第n个时驾期处捉于状胜态X(n)=i,转移因到过缝程终瓜结时底的总萄期望谦收益续为rij表示捆从状围态X(n)=i转移熟到下肯一个溪状态X(n+1)剑=j相应马的收拘益,秃则有某:πn表示图从第n个时假期到擦过程获终结港的决汉策规裂则δ的序般列其中δn为第n个时婶期的画决策踩规则棋,11臭.5马尔庄可夫仔决策Ma厚rk夸ov笛D庙ec线is栗io圾nq(i)表示链由状摆态i作一飘次转鱼移的咳期望伯报酬哥,即厦状态图的即垮时期外望报双酬.屑则令或11厘.5马尔勤可夫玩决策Ma接rk困ov辆D罩ec们is降io虏n若记段数从纠末端翁开始嫁,上坏式的嗽逆序猛写法多为:则11麦.7马尔腹可夫援决策Ma社rk稀ov吧D肯ec震is暖io膝n11撤.7马尔煮可夫赢决策Ma批rk雷ov蒸D传ec匆is笨io浆n【例】商品衰的转欠移概绣率矩站阵和拆利润熔表如何下畅销滞销畅销0.50.5滞销0.40.6畅销滞销畅销5010滞销20-20转移常概率晓表利润斩表(万元)q1=0踏.5著×5伪0+碎0.牧5×化10缴=3通0,盏q2=0叹.4盗×2饱0+经0.钱6×折(-拢20莲)=果-4n123456f1(n)304454.365.4376.54387.6543f2(n)-45.616.5627.65638.765649.87656期利润商预测11宣.5眠.5最优籍策略撕模型Ma课rk病ov决策添由五家重组搏来描盯述:1.状态i2.策略恩集秘,状圈态i的策章略规损则为3.转移敏概率掏矩阵P4.报酬麦,状张态i的策趋略规惧则为时转移叹到状梅态j的报魄酬为期望从即时趁报酬喝为5.目标教函数V(同n)11亲.5马尔滚可夫至决策Ma埋rk需ov正D讯ec为is缘瑞io者nMa锁rk每ov决策狸(MD用)描述在某一时刻秘(阶遥段)呜随机做变量X处于疾状态i,决策趴者选哄择某饶个策饮略使因目标蚊最优各。MD常用李的目浪标有3种:1.有限脱阶段格目标狗;2.折扣牧目标溉;3.平均糖目标有限旷阶段桨目标坐最大方。通炉过Z变换盲:11克.5马尔株可夫摧决策Ma菠rk剪ov窜D美ec稀is捧io尝n记i=1,趣2,删…迫,m(1席1.米18嘴)解方程啊组求橡出变粪量fi与v采用裕

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论