




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、系统工程殷复鹏山东建筑大学管理学院 系统工程人员作为参谋、智囊,将各种行动方案及其后果信息提供给决策者,让他们凭经验、直觉作出判断。系统工程人员着重于“谋”,而决策者着重于“断”。 系统工程各阶段的工作都属于“谋”的范围,那么在“断”的过程中系统工程人员是否可继续发挥作用?回答是肯定的。这不仅因为谋和断的关系密切,开明的决策者在断的过程中希望听取系统工程人员的意见,而且在系统分析中形成的评价和判断规则,实际上为决策者提供了“断”的科学方法和思路。决策分析就是一种规范的“断”的技术。第六章 决策分析方法 第六章 决策分析方法 第一节 管理决策概述 第二节 风险型决策分析 第三节 冲突分析第一节
2、管理决策概述引子:购买酿酒厂股票5500股二战爆发,谷物限制。每股价30$,股息为一桶威士忌。5500桶威士忌兑上80%土豆酒精售余3000桶,接受化学家建议。15000桶威士忌继续勾兑混和酒1944年8月,谷物限制放开。哈默决策问题举例第一节 管理决策概述引子:哈默哈默: 亿万富翁,美国实业界传奇式人物。少年得志,二十岁出头就是百万富翁。干一行成一行,行行挣大钱。总是在陌生的领域经营,但每每得手。在苏联造过铅笔,二战期间在美国酿过酒,饲养过纯种牛,开采过矿石,办过石油公司。第一节 管理决策概述1. 基本概念决策的定义: 狭义理解:决策即作出决定。70 年代前,“决策”在我国被狭隘地看作政治用
3、语,即“决定政策”。改革开放后,随着人们对国内外管理学与决策学的理解加深,对决策的理解也拓宽了。 广义理解:决策是一个过程,是人类的基本行为。决策是以问题为导向,决策主体在一定的环境与条件下,为实现一定的目标而制定行动方案,进行方案选择并准备方案实施的活动,是一个提出问题、分析问题、解决问题的过程。 所谓决策是人类的基本行为,是由于人类在行动之前一般都有一个思考和选择的过程,哪怕这个过程的时间极为短暂,这个过程就是决策。第一节 管理决策概述1. 基本概念系统决策的定义: 为实现特定的系统目标,运用系统工程方法对涉及的诸因素进行系统分析,对若干可行方案进行综合评价,从中选择最佳方案或满意方案所作
4、出的决定。诺贝尔奖获得者西蒙认为,系统决策分为四个阶段:(1)情报阶段:调查环境,寻求决策的条件和依据; (2)设计阶段:制定和分析可行方案;(3)抉择阶段:从可行方案中选一个行动方案;(4)实施与评价阶段:将行动方案付诸实施并评审。第一节 管理决策概述系统决策的特点: (1)系统决策面临的一般都是难度很大的多目标决策问题; (2)须用素质决策与数量决策结合的方法解决系统决策问题; (3)必须符合动态反馈的原则。第一节 管理决策概述系统决策问题的四个条件: (1)试图达到的明确目标; (2)不以决策者主观意志为转移的自然状态(一般两种以上); (3)两个或两个以上的可供选择的行动方案; (4)
5、不同行动方案在不同自然状态下的益损值可测。第一节 管理决策概述2. 决策问题的基本模式和常见类型 系统决策模型: 决策者的第i种策略或第i种方案,属于决策变量, 是决策者的可控因素; 决策者和决策对象(决策问题)所处的第j种环境条件 或第j种自然状态,属状态变量,是决策者不可控因素; 决策者在第j种状态下选择第i种方案的结果,是决策 问题的价值函数,一般叫易损值、效用值。 第一节 管理决策概述2. 决策问题的基本模式和常见类型 系统决策模型:写成矩阵形式状态概率益 损 值方案 1 2 j n P1 P2 . Pj . Pn 系统决策常见的类型: 第一节 管理决策概述3.几类基本决策问题的分析确
6、定型决策风险型决策不确定型决策对抗型决策 多目标决策 确定型决策方法(1)定义 是对未来状态已有确定把握时的决策。(2)它具备以下四个条件:存在着一个明确的目标;未来只有一种确定的自然状态;有两个以上的可行方案;各方案的在确定状态下的益损值可测。(3)方法:线性规划、目标规划。确定型决策方法线性规划法 确定型决策问题通常都可转化为在一定的条件(约束条件)下求收益最大值或损失最小值的问题,因此完全可以用运筹学的线性规划方法去解决。确定型决策方法线性规划法例 生产优化安排的数学模型某化工厂生产A、B两种产品,已知:生产A产品一公斤需耗煤9T,电力4000度和3个劳动日,可获利700元;B 4T,
7、5000度10 , 1200元。因条件限制,这个厂只能得到煤360T,电力20万度和劳动力300个,问:如何安排生产(即生产A、B产品各多少?)才能获利最多,请建立解决此问题的数学模型。 活 动 资 源产品A生产(1公斤)产品B生产(1公斤)资源的限制煤(T)94360电力(千度)45200劳动日(个)310300获利(百元)712确定型决策方法线性规划法 设生产A、B产品各为x1,x2公斤,则此问题变为求x1,x2满足下列条件:9 x1+4 x2 3604 x1+5 x2 200 3 x1+10 x2 300 x10, x20(1)使得总获利最大: max 7 x1+12 x2 (2) 显然
8、(1)为约束条件,(2)为目标函数,这是一个典型的线性规划模型。确定型决策方法线性规划法9x1 +4 x2 =360 x1x2408030609003x1 +10 x2 =3004x1 +5 x2 =200C(20,24)最优生产计划为:A产品:20公斤B产品:24公斤最大获利为42800元图解法:目标函数等值线:Z=7x1+12x2第二节 风险型决策分析 如所面临的未来状态不是完全确定的,而是具有随机性,且其概率可以估计,则根据概率计算得到的结果进行决策,其把握性比完全不确定型决策的把握性要大一些,但也还是要冒一定的风险。因此,将随机性决策称为风险型决策。风险型决策的五个条件(1)存在决策者
9、企图达到的明确目标;(2)存在决策者可选择的两个以上方案;(3)存在不以决策者意志为转移的两种以上状态;(4)不同方案在不同状态下的益损值可以计算出来;(5)可以估算出来各种状态出现的概率。若缺少条件(5),即成为完全不确定型决策问题。第二节 风险型决策分析 1.风险型决策分析的方法 (1)期望值法 把所采取的行动方案看成是离散的随机变量,则m个方案就有m个离散随机变量,离散变量所取之值就是行动方案相对应的损益值。离散随机变量X的数学期望为: 式中:第二节 风险型决策分析 例6-1: 显然,应选取中批生产方案(A2)作为决策方案。状态概率值(万元)行动方案大批生产(A1)中批生产(A2)小批生
10、产(A3)价格上涨10.3期望益损值 40 32 -6 36 34 24 20 16 14益损价格不变2价格不变30.60.130.633.617.0(2)决策树法 所谓决策树,就是利用树形图模型来描述决策分析问题,并直接在决策树图上进行决策分析。其决策目标(准则)可以是益损值期望值或经过变换的其他指标值。决策树如下图所示。123决策点自然状态点自然状态点概率枝概率枝概率枝概率枝结果点结果点结果点结果点方案分枝方案分枝修枝方块为决策点,由它画出若干线条,每条线代表一个方案,为方案分枝。方案分枝末端的圆圈,为自然状态点。从它引出的线条代表不同自然状态,叫概率枝。概率枝的末端的三角,为结果点,在结
11、果点旁,一般列出不同自然状态下的收益或损失值。(2)决策树法 例6-1决策树:价格上涨,0.3价格不变,0.6价格下跌,0.1123440万元32万元-6万元36万元34万元24万元20万元16万元14万元30.6万元33.6万元17.0万元A1A2A3价格上涨,0.3价格不变,0.6价格下跌,0.1价格上涨,0.3价格不变,0.6价格下跌,0.1 (3)多级决策树 有些决策问题需要经过多次决策才告完成,这种决策问题叫做多级决策问题。 例6-2:某化妆品公司生产BF型号护肤化妆品。由于现有生产工艺比较落后,产品质量不易保证,且成本较高,销路受到影响。若产品价格保持现有水平无利可图,产品价格下降
12、还要亏本,只是在产品价格上涨时才稍有赢利。为此公司决定要对该产品生产工艺进行改进,提出两种方案以供选择: 一是从国外引进一条自动化程度高的生产线; 二是自行设计一条有一定水平的生产线。 根据公司以往引进和自行设计的工作经验显示,引进生产线投资较大,但产品质量好,且成本较低,年产量大,引进技术的成功率为80%。而自行设计生产线,投资相对较少,产品质量也有保证,成本也较低,年产量也大,但自行设计的成功率只有60%。 进一步考虑到无论是引进或自行设计生产线,产量都能增加,因此,公司生产部门又制定了两个生产方案: 一是产量与过去相同(保持不变);二是产量增加,为此有需要进行决策。 最后若引进或自行设计
13、均不成功,公司只得仍采用原有生产工艺继续生产,产量保持不变。 (3)多级决策树 公司打算该护肤化妆品生产5年。根据以往价格统计资料和市场预测信息,该类产品在今后5年内价格下跌的概率为0.1,保持原价的概率为0.5,而涨价的概率为0.4。通过估算,可得各种方案在不同价格状态下的益损值如表所示:对各方案进行决策。 (3)多级决策树 建立多级决策树:引进生产线A1自行设计生产线A2失败(0.2)成功(0.8)跌价(0.1)原价(0.5)涨价(0.4)-100万元0125万元产量不变B1产量增加B2跌价(0.1)原价(0.5)涨价(0.4)-250万元80万元200万元跌价(0.1)原价(0.5)涨价
14、(0.4)-400万元100万元300万元失败(0.2)成功(0.8)跌价(0.1)原价(0.5)涨价(0.4)-100万元0125万元产量不变B1跌价(0.1)原价(0.5)涨价(0.4)-250万元0125万元跌价(0.1)原价(0.5)涨价(0.4)-350万元-250万元650万元95万元130万元产量增加B2130万元112万元75万元100万元100万元76万元112万元第二节 风险型决策分析 2.信息的价值 是否值得花费一定数量的代价获得必须的信息以供决策之需呢?如何评价信息价值? 决策所需要的信息一般分为两类: 一类是完全信息,即据此可以得到完全肯定的自然状态信息。 另一类是抽
15、样信息,是不完全可靠信息。 完全信息的价值 例6-3:某化工厂生产一种化工产品,对据统计资料的分析表明,该产品的次品率可以分为5个等级(即5种状态),每个等级(状态)的概率如表6-3所示。表6-3 五种状态及其概率值 通过进一步分析可知,次品率的高低与该产品所用主要原料的纯度有关。今已知,化工原料纯度越高,次品率越低,反之,次品率越高。而化工原料的纯度高低,又与运输、保存日期等因素有关。为此,工厂主管生产的部门建议在生产该产品前,现对该化工原料增加一道“提纯”工序。通过提纯工序,能使全部原料处于S1状态,从而降低了次品率。完全信息的价值 但是增加提纯工序就增加了工序费用。经过核算可知,每批原料
16、的提纯费用为3400元。经估算,在不同纯度状态下其益损值如表6-4所示。表6-4 益损值表 如果生产前先将化工原料检验一下,通过检验可以掌握每批化工原料处于何种纯度状态,这样可以对不同纯度的原料采用不同的策略,即提纯或不提纯,从而使益损期望值为最大。 用决策树法对该问题进行分析。 1000元4400元A1A21000元3200元A1A21000元2000元A1A21000元800元A1A21000元-400元A1A21000元1000元1000元1000元1000元S1(0.20)S2(0.20)S3(0.10)S4(0.20)S5(0.30)2000元4400元3200元800元-400元S
17、1(0.20)S2(0.20)S3(0.10)S4(0.20)S5(0.30)-50元2200元4400元3200元2000元1000元1000元1000元1760元S1(0.20)S2(0.20)S3(0.10)S4(0.20)S5(0.30)A1A2不检验检验1760元2170元完全信息的价值:2200-1760=460元抽样信息的价值 例6-4:某家电公司由于原产品结构陈旧落后、产品质量差而销路不广。为了满足广大消费者日益增长的需求,公司拟对产品结构进行改革,制定了两种设计方案: (1)全新设计方案(A1),即产品结构全部重新设计。 (2)改型设计方案(A2),即在原有产品结构的基础上加
18、以改进。 如果是全新设计方案,由于结构全部重新设计,原有许多工艺装备都不能继续利用,需重新添置,故投资费用较大。但由于结构新而工艺先进,故可提高产品质量和生产率。如果产品销路好,则工厂可获较大收益;反之,如果销路差,则因开工不足,投资不能及早回收,公司亏损也大。如果采用改进型设计方案,则原有工艺装备基本上都可利用,故投资费用少,因此无论销路好或差,都能获得一定收益而不致亏损。 抽样信息的价值 公司根据往年的统计资料可知,销路好的概率为0.35,销路差的概率为0.65。计划将该产品生产5年,其益损值可以估算,如表6-5所示。 表6-5 益损值表 单位:万元 公司为了进一步确定采用哪种设计方案,要
19、对产品销路问题作专门调查和预测。但由于影响销路好或差的因素颇为复杂,因此依靠调查和预测所得信息并不完全正确可靠,销路好或差的信息只有在销售过程只能够才能真正得到可靠的结论。抽样信息的价值 所以预测所得到的信息只是抽样信息。根据以往经验,得出销路好结论的信息,其可靠程度只有80%,得出销路差结论的信息,其可靠程度只有70%。为了决定这种预测是否值得去做,必须通过计算和分析才能知道。 可先画出多级决策树。 设G产品销路好; B产品销路差; fg预测结果为产品销路好这一事件; fb预测结果为产品销路差这一事件。 P(G)产品销路好的概率,已知P(G)=0.35; P(B)产品销路差的概率,已知P(B
20、)=0.65。 P(G)45万元-22.5万元P(B)P(G)18万元4.5万元P(B)P(G/fg)45万元-22.5万元P(B/fg)P(G/fb)45万元-22.5万元P(B/fb)P(G/fg)18万元4.5万元P(B/fg)P(G/fb)18万元4.5万元P(B/fb)全新设计改型设计全新设计改型设计全新设计改型设计不预测预测P(fg)P(fb) P(G)45万元-22.5万元P(B)P(G)18万元4.5万元P(B)P(G/fg)45万元-22.5万元P(B/fg)P(G/fb)45万元-22.5万元P(B/fb)P(G/fg)18万元4.5万元P(B/fg)P(G/fb)18万元
21、4.5万元P(B/fb)全新设计改型设计全新设计改型设计全新设计改型设计不预测预测P(fg)P(fb)抽样信息的价值 P(fg/G)产品销路好,而预测结果销路也好的概率,根据题意可知P( fg/G )=0.8; P( fb/G )产品销路好,而预测结果销路差的概率, P( fb/G )=1-0.8=0.2。 P(fg/B)产品销路差,而预测结果销路也差的概率,根据题意可知P( fg/B)=0.7; P( fb/B )产品销路差,而预测结果销路好的概率, P( fb/B )=1-0.7=0.3。 抽样信息的价值 P(fg)预测结果为销路好的概率之和,其值为: P(fg)= P( fg/G )P(
22、G)+ P( fg/B )P(B) =0.80.35+0.30.65 =0.475 P( fb )预测结果为销路差的概率之和,其值为: P(fb)= P( fb/B )P(B)+ P( fb/G )P(G) =0.70.65+0.20.35 =0.525 抽样信息的价值 根据贝叶斯公式,可计算有关的条件概率为: P(G/ fg )预测结果认为产品销路好,而产品销路确实好的概率,其计算公式及数值为: P(B/ fg )预测结果认为产品销路好,而产品销路实际却为差的概率,其计算公式及数值为:抽样信息的价值 根据贝叶斯公式,可计算有关的条件概率为: P(G/ fb )预测结果认为产品销路差,而产品销
23、路却为好的概率,其计算公式及数值为: P(B/ fb )预测结果认为产品销路差,而产品销路确实为差的概率,其计算公式及数值为: P(G)=0.3545万元-22.5万元P(B)=0.65P(G)=0.3518万元4.5万元P(B)=0.65P(G/fg)=0.58945万元-22.5万元P(B/fg)=0.411P(G/fb)=0.13345万元-22.5万元P(B/fb)=0.867P(G/fg)=0.58918万元4.5万元P(B/fg)=0.411P(G/fb)=0.13318万元4.5万元P(B/fb)=0.867全新设计改型设计全新设计改型设计全新设计改型设计不预测预测P(fg)=0
24、.475P(fb)=0.525 P(G)=0.3545万元-22.5万元P(B)=0.65P(G)=0.3518万元4.5万元P(B)=0.65P(G/fg)=0.58945万元-22.5万元P(B/fg)=0.411P(G/fb)=0.13345万元-22.5万元P(B/fb)=0.867P(G/fg)=0.58918万元4.5万元P(B/fg)=0.411P(G/fb)=0.13318万元4.5万元P(B/fb)=0.867全新设计改型设计全新设计改型设计全新设计改型设计不预测预测P(fg)=0.475P(fb)=0.5251.125万元9.225万元17.26万元12.56万元-13.5
25、0万元6.30万元9.225万元17.26万元6.30万元11.505万元11.005万元-0.5万元抽样信息的收益期望值为:11.505-9.225=2.28万元第二节 风险型决策分析 3.效用曲线的应用 前面的研究都是以损益的期望值作为评选方案的标准。但决策者的主观性和客观环境会对决策过程产生重要影响。虽然损益期望值可以作为决策的主要依据,但以其为唯一标准是不符合实际的。 例: 500万元资产的木材厂火灾的概率为0.001,则火灾损失期望值为5000元。如购买保险(费用为5500元),则不发生火灾的损失期望值为0.999*5500,约为5500元。但是工厂还是会购买保险,因为一旦发生火灾,
26、其风险无法接受。 3.效用曲线的应用 事实上,对不同损失期望值,不同决策者的态度不一定相同。这由其不同素质、心理、处境、对未来的期望等决定。 决策者对于利益和损失的独特的兴趣、感觉或反应,叫做效用。效用实际上代表了决策者对于风险的态度。 效用函数至少有以下三类:损益值效用值1.00+-保守型(风险厌恶)进取型(风险追求)中立型3.效用曲线的应用 同一个决策者在不同时期对损益值的态度也可能不同有拐点的效用函数:损益值效用值1.00+-损益值效用值1.00+-3.效用曲线的应用 效用和决策者的观念有关,故难以准确度量。效用曲线一般通过心理测试法求出。 确定当量:如果后果C1和期望(P,C2;(1-
27、p),C3)对于一个决策者而言是等价的,则称后果C1是期望(P,C2;(1-p),C3)的确定当量。 例(商家促销活动):以500元购买商品后商家提供两种返利选择,直接返还50元;或参加抽奖,以概率60%得到100元,40%没有返利。如果消费者认为两者对他意义相同,则直接得到50元是上述抽奖活动的确定当量。 3.效用曲线的应用 举例:带伞问题 C1,C2,C3,C4,分别表示四个后果,C1=(下雨,带伞),C2=(不下雨,带伞),C3=(下雨,不带伞),C4=(不下雨,不带伞)。这四个后果的优先关系是C4 C1 C2 C3。 3.效用曲线的应用 解:选择最好和最差的结果为基准,令u(C4)=1
28、,u(C3)=0。后果C1,C2的效用由咨询求得。 10如决策人如果经过思考认为:带伞没有下雨(C2)等价于(没有带伞,但是0.4的概率下雨和0.6的概率不下雨),则 U(C2)=0.4 u(C3)+0.6 u(C4)=0.6 0.63.效用曲线的应用 如果他还认为:带伞下雨(C1)等价于(没有带伞,但有0.1的概率下雨和0.9的概率不下雨),则u(C1)=0.1 u(C3)+0.9 u(C4)=0.9 100.60.9本例中老年人和青年人可能有很大的差异。老年人不愿意冒险,因此他把C2(带伞无雨)和C3(不带伞下雨)、C4(不带伞无雨)比较时,会比较强调不下雨。例如他认为不遇雨的概率应该为0
29、.8才能等价。对此,老年人有 u(C2)=0.2 u(C3)+0.8 u(C4)=0.8年轻人可能认为,即使较大可能遇到雨,如概率0.6,他也愿意当作等价,则年轻人有u(C2)=0.6 u(C3)+0.4 u(C4)=0.4效用有主观性!3.效用曲线的应用 例6-5:某制药厂欲投产A、B两种新药,但受资金及销路限制,只能投产其中之一。若已知投产新药A需要资金30万元,投产新药B只需资金16万元,两种新药生产期均定为5年。估计在此期间,两种新药销路好的概率为0.7,销路差的概率为0.3。它们的益损值如表6-6所示。问究竟投产哪种新药为宜?表6-6 益损值表 单位:万元3.效用曲线的应用 采用益损
30、期望值作为决策准则,如下图,显然以生产新药A为最优。70万元-50万元好(0.7)差(0.3)24万元-6万元好(0.7)差(0.3)AB34万元15万元34万元3.效用曲线的应用 用效用值作为决策标准,其步骤如下: (1)绘制决策人的效用曲线。设70万元的效用值为1.0, -50万元的效用值为零,然后决策人经过多次辨优过程,找出与益损值相对应的效用值后,就可以画出决策人的效用曲线。00.10.20.30.40.50.60.70.80.91.0-5070-624益损值/万元效用值3.效用曲线的应用 (2)根据效用曲线,可以找出方案B的与益损值相对应的效用值,分别为0.82和0.58,将其标注在
31、决策树相应的结果节点右端。这样就可以用效用期望值为决策准则进行计算和决策。00.10.20.30.40.50.60.70.80.91.0-5070-624益损值/万元效用值3.效用曲线的应用 70万元(1.0)-50万元(0)好(0.7)差(0.3)24万元(0.82)-6万元(0.58)好(0.7)差(0.3)AB34万元15万元34万元3.效用曲线的应用 新药A的效用期望值为: 0.71.0-0.30=0.70 新药B的效用期望值为: 0.70.82+0.30.58=0.75。 由此可见,若以效用期望值作为决策标准,生产新药B的方案比生产A的方案为优。这是因为决策人是一个保守型的人物,不愿
32、冒太大的风险。第三节 冲突分析 冲突是一种社会现象,普遍地存在于我们现代生活的各个方面。它可以小到个人之间的分歧和矛盾,大到社会集团,乃至国家与地区之间的经济或政治利益上的争端和冲突。冲突发生时,至少涉及到两个或更多的冲突方面,参与冲突的各方具有不同的利益和目的,都想通过一定的策略选择来达到自己的目的。但是冲突的结果往往要取决于冲突各方的策略选择,而不能由某一方单独决定。 例如,在经济领域里,各国之间的贸易谈判,各企业之间的加工或订货谈判,各企业之间在国际、国内市场的竞争,企业对新产品和新技术的开发和利用等,都是冲突现象。在这些冲突中,所有涉及的企业都具有不同的利益,都希望通过一定的策略选择,
33、来达到对自己有利的结果。而同时,又没有任何一方能够单独决定谈判结果或有能力垄断市场。 第三节 冲突分析 因此在这些冲突中,决策者需要根据冲突各方的利益和可能采取的行动来决定自己应该采取的策略。在政治方面,国际上各国政府之间的外交谈判,各方都想在谈判中处于有利地位,争取到对自己有利的结果。当矛盾不能得到妥善解决时,冲突就可能激化,甚至导致战争,这时冲突就会变成你死我活的斗争。由于冲突现象与经济、政治、社会、文化和环境等密切相关,对冲突现象的研究已日益引起广泛的注意。 第三节 冲突分析 1.对策论与冲突分析 冲突分析是国外在经典对策论和偏对策论基础上发展起来的一种对冲突行为进行正规分析的决策分析方
34、法。 第三节 冲突分析 1.对策论与冲突分析 对策是决策者在某种竞争场合下作出的决策,是一种人为的不确定型决策(竞争或对抗型决策)。作为一种特殊的决策问题,对策的基本模式(概念模型): 冲突分析的主要特点: (1)能最大限度地利用信息; (2)具有严谨的数学(集合论)和逻辑学基础; (3)冲突分析既能进行冲突事态的结果预测(事前分析),又能进行事态过程描述和评估(事后分析); (4)分析方法在使用中几乎不需要任何数学理论和复杂的数学方法,很容易被理解和掌握; (5)冲突分析用结局的优先序代替了效用值,并认为对结局比较判断时可无传递性,从而在实际应用中避开了经典对策论关于效用值和传递性假设等障碍
35、。第三节 冲突分析 2.冲突分析的程序及要素 冲突分析的一般过程 (1)对冲突事件背景的认识与描述。内容包括:冲突发生的原因(起因)及事件的主要发展过程;争论的问题及其特点;可能的利益和行为主体及其在事件中的地位及相互关系;有关各方参与冲突的动机、目的和基本的价值判断;各方在冲突事态中可能采取的行动。 第三节 冲突分析 2.冲突分析的程序及要素 冲突分析的一般过程 (2)冲突分析模型(建模)。在初步信息处理之后,对冲突事态进行稳定性分析用的冲突事件或冲突分析要素间相互关系及其变化情况的模拟模型,一般用表格表示。 第三节 冲突分析 2.冲突分析的程序及要素 冲突分析的一般过程 (3)稳定性分析。
36、是使冲突问题得以“圆满”解决的关键,其目的是求得冲突事态的平稳结局(局势)。所谓平稳局势,是指对所有局中人都可接受的局势(结果),也即对任何局中人,更换其策略后得到的新局势,而新局势的效用值(赢得)或偏好度都较原局势为小,则称原来的局势为平稳局势。平稳局势亦为最优结局(最优解)。第三节 冲突分析 2.冲突分析的程序及要素 冲突分析的一般过程 (4)结果分析与评价。主要是对稳定性分析的结果(即各平稳局势)作进一步的逻辑分析和系统评价,以便向决策者提供有实用价值的决策参考信息。第三节 冲突分析 2.冲突分析的程序及要素 冲突分析的基本要素时间点局中人选择或行动结局优先序或优先向量冲突分析的基本要素
37、 (1)时间点。说明“冲突”发生时刻的标志;对于建模而言,则是能够得到有用信息的终点。 (2)局中人。是指参与冲突的集团或个人(利益主体),他们必须有部分或完全的独立决策权(行为主体)。冲突分析要求局中人至少有两个或两个以上。局中人集合记作N, 局中人可以是个人,也可以是集体,例如,企业、政府或国家等。在实践中,为了研究问题清楚起见,利益与行动完全一致的参与者往往被视为同一个局中人。例如,在一场球赛中,比赛双方各有许多队员,但我们仍将比赛模拟为二人对策。冲突分析的基本要素 (3)选择或行动。它是各局中人在冲突事态中可能采取的行为动作。冲突局势证实由各方局中人各自采取某些行动而形成的。 每个局中
38、人一组行动的某种组合称为该局中人的一个策略。 第i个局中人的行动集合记作Oi, 请注意,这里一个完整的行动方案并不是指某个单独的行动,而是指一组对所有行动的选择。例如,在一场劳资冲突中,工会有三项行动可供选择:A.接受资方提出的提高工资3%;B.提出提高工资5%的提案;C.罢工。基于这些可供选择的行动,工会有许多策略,如“拒绝3%的提案;提出5%的要求;但不罢工”。因为工会不可能在接受3%提案的同时提出5%的要求,所以任何涉及同时选择这两项行动的方案都是不可行的。冲突分析的基本要素 (4)结局。各局中人冲突策略的组合共同形成冲突事态的结局。全体策略的组合(笛卡尔乘积或直积)为基本结局集合,记作
39、T, (5)优先序或优先向量。各局中人按照自己的目标要求及好恶标准,对可能出现的结局(可行结局)排出优劣次序,形成各自的优先序(向量)。囚徒困境 囚徒困境是一个典型的22冲突问题。在这个对策问题中,囚徒甲和乙因涉嫌于一个重要案件而被拘留,法官确信他们有罪但没有足够证据给他们定罪。为此,法官将两人分别监禁并告诉他们以下条件,每个囚徒需要在坦白与不坦白之间做出选择。 (1)如果两人都不坦白,那么法官将以一件较轻的罪名(如非法持枪)将他们各判1年徒刑。 (2)如果两人都坦白,他们将被起诉,但在量刑上可以从轻,每人各判5年。 (3)如果只有一人坦白,则坦白者不被追究刑事责任,不坦白者受此最最重刑,10
40、年监禁。囚徒困境 甲只能控制行之间的变化,而乙只能控制列之间的变化。每一行列的交叉都表示一个结局。因为每一决策人只有两个策略,所以共有四个结局。每个结局都用两个数据表示决策人对于该结局的偏好,其中第一个数字是囚徒甲的偏好,第二个是囚徒乙的偏好。3,31,44,12,2坦白不坦白坦白不坦白囚徒甲囚徒乙囚徒困境模型:标准式囚徒困境 囚徒困境的0-1式。囚徒困境:决策人和行动囚徒困境 在偏好向量中,根据每个囚徒对四个结局偏好值,把结局从左向右排列,偏好值最高的排在最左边,偏好值最低的排在最右边。如下图:囚徒困境 在偏好向量中,根据每个囚徒对四个结局偏好值,把结局从左向右排列,偏好值最高的排在最左边,
41、偏好值最低的排在最右边。如下图:囚徒困境稳定性分析 在稳定性分析中,需要根据选用的决策准则确定每个结局相对于每个决策人的稳定性;当一个结局出现的时候,如果决策人能够通过单独改变自己的策略而达到一个更好的结局,那么这个结局对于该决策人就是不稳定的。因此在稳定性分析的第一步,我们需要确定决策人在每个结局所具有的单独改变自己的策略而达到一个更有利的结局的能力。 从前面的表格可见,在结局1和2中,囚徒乙的策略都是(1,0),即不坦白,而甲的策略是(1,0)或(0,1)。因此,在结局1甲可以单独改变自己的策略从(0,1)到(1,0),从而使结局从1变到2。所以结局2是甲在结局1的UI。3,31,44,1
42、2,2坦白不坦白坦白不坦白囚徒甲囚徒乙囚徒困境稳定性分析 (1)合理稳定性。对于一个决策者来说,如果他在某一个结局上不能单独改进自己的处境,那么这个结局对该决策者就是合理稳定的,记作r。上表中结局2和4对甲是理性稳定的,而结局3和4对乙是理性的。3,31,44,12,2坦白不坦白坦白不坦白囚徒甲囚徒乙rrrr囚徒困境稳定性分析 (2)连续稳定性。在改进后的新结局上,其他决策人可以运用他们的UI结局使局势再次变化,而由此产生的结局比初始结局还要差,这种可能性将迫使该决策者放弃使用自己的UI而造成稳定。这种由于UI被制裁造成的稳定称为连续稳定性。 以P甲中的结局1为例,在结局1中,甲有UI2,由此
43、甲可以把形势由1改变到2。但是在结局2,乙也有UI,乙可以将形势由2改变到4。比较初始结局1和终止结局4,对甲来说,4比1要差,所以甲的UI被制裁,结局1对甲是连续稳定的,我们在1上标准s。3,31,44,12,2坦白不坦白坦白不坦白囚徒甲囚徒乙rrrrss囚徒困境稳定性分析 (3)不稳定性。在一个结局上,如果决策人至少有一个未被制裁的UI,那么这个结局对于该决策人就是不稳定的,简记为u。3,31,44,12,2坦白不坦白坦白不坦白囚徒甲囚徒乙rrrrssuu囚徒困境稳定性分析 当一个结局对于所有的决策人都具有某种稳定性时,那么这个结局就是具有整体稳定性,并形成一个稳定解。在一个稳定解上,没有
44、决策人能够单独地偏离这个结局。在囚徒困境中有两个稳定解,它们是结局1=(不坦白,不坦白)和结局4=(坦白,坦白)。3,31,44,12,2坦白不坦白坦白不坦白囚徒甲囚徒乙rrrrssuu个人稳定性个人稳定性整体稳定性XXEE3. 冲突分析基本方法举例古巴导弹危机 背景:P156 1956年末至1959 1961年4月及1961年中 1962年10月14日 3. 冲突分析基本方法举例古巴导弹危机 在当时的情况下,前苏联在古巴设立导弹基地可能有如下几点考虑: (1)把古巴导弹基地作为美国撤除其在土耳其和意大利导弹基地的交换条件; (2)如果美国对古巴采取强硬措施,世界舆论将对美及其不利,这时,前苏
45、联就可能乘“虚”进攻西柏林; (3)建立导弹基地履行了前苏联“保卫古巴”的诺言,有助于维护前苏联在第三世界国家中的威望; (4)针对美国而在古巴设置导弹基地,是前苏联在“冷战”中的一个巨大而冒险的迈进,这时如果美国举棋不定,那将会使它对其他国家的许多承诺付诸东流,有争议的柏林问题也将改变面貌; (5)古巴导弹基地的设置是平衡美苏核力量的有效措施。3. 冲突分析基本方法举例古巴导弹危机 美国成立的委员会研究的结果,美国可能采取的行动大致有: (1)不采取任何进攻性行动,基本维持现状; (2)在海上由美国海军设置一个封锁圈,作为防止一切有利于古巴舰只出入的禁区; (3)空袭前苏联设在古巴的导弹基地
46、。 该委员会认为前苏联相应可能采取的行动大致有: (1)不从古巴撤回导弹基地,基本维持现状; (2)撤回导弹基地; (3)加剧局势的紧张化,使事态升级,这可通过入侵西柏林、袭击美国军舰等来实现。3. 冲突分析基本方法举例古巴导弹危机 本分析的目的在于用正规分析的方法检验美国当年所采取军事对策的合理性,并帮助掌握冲突分析的基本方法。3. 冲突分析基本方法举例古巴导弹危机建模: (1)时间点。选在1962年10月,此时冲突局势已基本明朗,且有关各方要对所可能采取的行动作出决定。 (2)局中人。实际的参与者有三个:美国、前苏联和古巴。古巴无与冲突有关的独立行动,实际取美国和前苏联。 (3)选择(行动
47、)。美国为改变现状有两个可能的行动,即设封锁圈或空袭;前苏联也只有两个新行动,即撤除和使事态升级。 (4)结局的表达。分别用“1”和“0”表示某行动的“取”和“舍”。 分析时,用十进制数表达比较方便,转换公式为: 3. 冲突分析基本方法举例古巴导弹危机 据此,可得到古巴导弹危机的16( )个基本结局。 表6-7 古巴导弹危机中的局中人及其行动和基本结局 在基本结局中,由于前苏联的行动一般不可能是既撤除导弹基地,同时又加剧局势的紧张化(使事态逐步升级),因此最后四个结局从逻辑上是不可行的,应该删除,剩余的12个结局均认为是可行结局。3. 冲突分析基本方法举例古巴导弹危机 (5)优先序的确定。在优
48、先序中,最有利的结局排在左边,最不利的结局排在右边。经过对美、苏双方的反复研究,确定出各自的优先序,如表6-9和表6-10所示的结果。表6-8 古巴导弹危机中的可行结局3. 冲突分析基本方法举例古巴导弹危机表6-9 美国在古巴导弹危机中的优先序(向量)表6-10 前苏联在古巴导弹危机中的优先序(向量) 在优先序中,尽可能避免冲突紧张化而导致核战争等是双方的共同原则。在此基础上,美国力图使前苏联撤除导弹基地,前苏联则极希望维持现状。3. 冲突分析基本方法举例古巴导弹危机稳定性分析: 稳定性分析解决从所有可行结局中求得平衡结局的问题。 在这个过程中,基本的事实是(三个先决条件): (1)每个局中人
49、都将不断朝着对自己最有利的方向改变其策略; (2)局中人在决定自己的选择时都会考虑到其他局中人可能的反应及对本人的影响; (3)平衡结局必须是能被所有局中人共同接受的结局。 稳定性分析的基本过程: (1)确定单方面改进(UI)。假定某一局中人不改变其策略,而另一局中人单方面改变其策略使自己的处境更好则形成单方面改进,即对局中人A而言,考虑结局q,如果A可以通过改变自己的策略使q变到q, q且优于q,则称对于A,q存在单方面改进q,记作UI。 单方面改进(UI)是稳定性分析的基础状态,对UI的分析是稳定性分析的第一步。每个可行结局的UI均列在优先序号与之对应的结局(q)的下面,并按照优先程度的高
50、低从上到下依次排列,见表6-11。稳定性分析的基本过程: 表6-11 古巴导弹危机的稳定性分析稳定性分析的基本过程: (2)确定基本的个体稳定状态。以UI为基础,可得到三种基本的个体稳定状态,它们是: 1)合理性稳定结局。对局中人A而言,考虑结局q,如果不存在单方面改进,即无UI,则称对于A,q是合理稳定的结局,记作r。也就是在局中人B不改变其策略时,对局中人A,结局q是最优的。 2)连续处罚性稳定结局。对局中人A考虑结局q,如果存在UI结局q,而结局q对局中人B,也存在UI结局q ,但结局q 对于局中人A不比q更优,则称结局q的UI结局q存在着一个连续性处罚。 对局中人A的结局q的全部UI结
51、局都存在连续性处罚,则称对于局中人A,结局q为连续处罚性稳定结局,记作s。 稳定性分析的基本过程:3)非稳定结局。对局中人A而言,考虑结局q,如果存在UI,但又不是s,则称对于A,q是非稳定的结局,记作u。有以下两种情况: 12 三种基本的个体稳定状态分析及其结果见表6-11,需要注意的是表中对应于美国的结局5和7不是s。稳定性分析的基本过程:(3)分析同时处罚性稳定。 同时处罚性稳定结局:对局中人A而言,考虑非稳定结局q,如果另一局中人B,对于结局q也是非稳定的,那么结局q的UI结局ai(对于局中人A)、 bi(对于局中人B)同时UI(合成)产生结局pk中,存在一个p0,对于局中人A而言,不
52、比q更优,则称对于居中人A,结局q的UI结局a0存在一个同时性处罚。若对于局中人A,结局的全部UI结局( )都存在同时性处罚,则称对于局中人A,解决q为同时处罚性稳定结局,记作 。 同时处罚稳定性分析是在前面三种基本个体稳定性确定之后进行的。两个局中人(A和B)同时UI产生的结局p的计算公式为:稳定性分析的基本过程: 【说明】 设初始结局q到a、b的变化量分别为eA、eB,即有 则因 (同时变化,即变化量叠加) 故 据此,古巴导弹危机稳定性分析中的同时处罚稳定性计算的中间结果如表6-12所示。 通过比较可以看出,q=1,3,8,9,10对美、苏双方皆不稳定,即均未构成同时处罚。稳定性分析的基本
53、过程: 结局p的求解除采用计算法外,还可使用以下两种分析方法得到: 1)逻辑推断法,如下:其中:“”为UI,即单方面改进(善)q=12 65 4,6前苏联美国p=6美国前苏联q=611 7,35 4,6,7前苏联美国p=7,3美国前苏联1 2,3,0美国其中:“ ”为UC,即单方面变化稳定性分析的基本过程: 结局p的求解除采用计算法外,还可使用以下两种分析方法得到: 2)结局组合法,如下:美国前苏联“1”:“1”:10001000“2”:“5”010010100110“6”:虚线所框为原结局(1,0,0,0)中改变的部分。稳定性分析的基本过程:(4)确定全局稳定结局。 如果结局q对于每个局中人
54、都属于(r,s, ),则称结局q为全局平稳结局,记作E,这是稳定分析的结果。在古巴导弹危机中,E=4,6,见表6-11。3. 冲突分析基本方法举例古巴导弹危机结果分析: (1)全局稳定结局有两个,即4和6,到底哪一个是真正的结果呢?需要进一步作如下分析: 1962年10月中旬,美国还没有采取什么行动,前苏联既没有撤除导弹基地,也没有加剧局势的紧张化,即结局处于“0”的情况。由表6-11得知,结局“0”对于前苏联是合理性稳定的,但对于美国是非稳定的,即存在UI,且最希望改进到结局“2”。这样,结局“2”对于美国是稳定的,但对前苏联是非稳定的,可以UI到结局“6”。结局“6”对于美国和前苏联都是稳定的。所以古巴导弹危机的最终结果是“6”,即美国设置封锁圈,前苏联撤除导弹基地。 通过分析可以得出整个事态发展的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 芒果皮果茶行业跨境出海项目商业计划书
- 2023年高考备考班主任工作经验交流材料
- 幼儿园节能减排膳食管理制度范文
- 农业机械现场技术服务和人员培训计划
- 古筝培训机构教学课件
- 大班健康膳食宝塔课件
- 中学教师信息技术应用研修心得体会
- 老子五章教学课件
- 建筑模型设计与制图心得体会
- 金华市成功学校招聘真题
- 科技革命与产业变革-深度研究
- 部编初中历史八下第14课海峡两岸的交往教案
- 《智慧化工园区系统运维管理要求》
- 17J008挡土墙(重力式、衡重式、悬臂式)图示图集
- T管造影及胆道解剖培训课件
- 人工智能技术发展现状及未来趋势分析
- 《工程建设质量信得过班组建设导则》
- 高支模合同范例
- 中国AI制药企业白皮书
- 2025年中国夜间经济行业研究报告:市场规模、供需态势、发展前景预测
- 医疗急救车调度制度
评论
0/150
提交评论