




下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、DMD无敌攻略(2007版)DMD无敌攻略郭善琪133.01.28.93.89guoshq.06摘要(1) 概念与方法;(2) 案例与分析;(3) 应考策略。1 概念&方法本学期DMD主要介绍了六个方面的内容:一、决策树;二、概率论基本知识;三、抽样;四、仿真;五、回归;六、规划其中概率论部分不作为考试部分,但是对于理解第三、四、五部分非常重要。1.1 决策树【1】 基本构造:由决策节点、事件节点和分支组成。ü 决策节点:当在某种条件下或在某个时间点需要对若干备选方案选择一种时,我们画个小方框标记这次决策,称之为决策节点;从决策节点上向右引出若干分支代表备选方案称之为决策枝;
2、ü 事件节点:当在某种情况下面临某几种未知状况时,用一个小圆圈代替这种情况,称之为事件节点;从事件节点上向右引出若干分支代表可能出现的状况称之为事件枝。【2】 构造方法:a) 首先,找出需要做的子决策和所面临的事件点,注意:子决策一定是需要做出选择,事件点一定是面临两种以上未知状况。b) 其次,将子决策和事件点按照时序和逻辑关系构造成决策树,注意:从左到右一定是决策或事件发生的先后顺序。c) 再次,确定决策标准,注意:决策标准一定是量化的。d) 最后,每个末端分支的收益和每个事件枝的发生概率。【3】 决策过程a) 赋值计算:从右到左依次计算每个节点的期望收益,其中事件节点的期望收益的
3、计算方法是把每种可能情况(事件枝)的期望收益与发生概率相应相乘然后相加;决策节点的期望收益的计算方法是在每种决策枝后面的节点的期望收益中取最大值;b) 断枝选择:从左到右依次比较每个决策节点的分支的期望收益的大小,从中选择期望收益值最大的作为行动方案,把同一节点的另外所有分支全部砍断。1.2 概率论基本知识自己看看书即可。1.3 抽样【1】 基本内容:在总体数据不可能全部获得的前提下,通过对抽样数据的分析对总体数据的均值、方差、可能的分布进行估计。【2】 基本公式及其说明: a) 用样本的平均值来估计总体的均值:b) 对总体方差的估计:以上两个公式都没多大用,因为这些工作直接交给电脑去做即可。
4、因为上述两个值本质上都是估值,所以它们并不代表真正的均值和方差。但是真正的均值和方差我们是不得而知的,因此我们需要根据估计的均值和方差对真正的均值可能出现在某个区间的概率进行估计。这就是置信区间。也就是说,我们通过估计的均值和方差有多大把握认为,总体的均值会出现在某个区间。c) 3)置信区间1:如果P(cZc)/100, 我们就有的把握认为,总体的均值会出现在区间内。其中是对总体的均值的估值,s是对总体的方差的估值。如果已知总体的分布符合正态分布或总体不符合正态分布但n>30,则可按c的值从标准正态分布表中查得;否则即从t分布表中查得。其中自由度k既是样本数n1。友情提示:正态分布表中c
5、和的对应关系是P(Zc)/100,是单侧的;t分布表中c和的对应关系是P(cZc)/100,是双侧的。d) 4)置信区间2:有两组代表不同总体的抽样数据,他们所代表的总体是相互独立的,他们的数据个数分别是n1、n2,均值的估值分别是、,标准差的估值分别是s1、s2,如果P(cZc)/100, 我们就有的把握认为,两个总体的差值的均值E(X1X2)会出现在区间内。如果已知总体的分布符合正态分布或总体不符合正态分布但n>30,则可按c的值从标准正态分布表中查得;否则即从t分布表中查得。其中自由度k既是样本数n1。友情提示:上述公式与前面的估计其实本质上是一样的,只不过令XX1X2 ,E()E
6、 ()E(),S(),【3】 基本命令a) 均值:“=AVERAGE(A1:A30)”,地球人都知道,无须多说。b) 标准差:“=STDEVP(A1:A30)”是从样本估计总体的标准差,“=STDEV(A1:A30)”是直接计算样本的标准差。c) 置信系数C:“=CONFIDENCE((1),1,1)”;如果想直接得到置信区间-a, +a中的a值,则可输入“=CONFIDENCE((1),s,n)”,其中s是标准差,n是样本数。友情提示:必须是小于或等于1的数,n是整数; 在工作表中输入公式时括号中的字母必须统统换成数字或单元格1.4 仿真【1】 作用:在总体数据不可知同时无法进行抽样或抽样的
7、成本太高,但是我们对总体的分布比较熟悉时,不失为获得数据的很好的途径;【2】 注意事项a) 需要仿真的总体:在仿真之前我们也要弄清楚需要的究竟是那些数据,这些数据是不是不依赖其它数据而存在的。b) 总体的分布:应该是仿真的难点。如果案例中明显给出了总体的分布类型,当然一切都没有问题;如果既没给出分布类型,也没给出历史数据也没太大问题,根据大致的逻辑假设一下即可;如果没给出分布类型但给出了历史数据就麻烦了,需要从几方面着手:1) 画直方图,注意一定要多做几次,从直方图的形状来观察;2) 从历史数据的均值和方差的关系来推测,如果均值和标准差大致相等很可能是指数分布,如果均值大致居中,方差等于分布区
8、间上下限之差的平方除以12,则很可能是均匀分布;3) 在案例中数据所反映的实际问题,明显只能取整数的要在二项分布,泊松分布中考虑,取值比较连续的则应该考虑均匀、指数、正态等分布。1.5 回归【1】 作用:对已有的若干组数据进行分析,找出数据之间的线性关系;【2】 在DMD案例中应用回归的目的:a) 对未知数据进行推测,有些数据可能由于种种关系难以获得,但我们可以获得与其相关的其他数据,通过回归得出的关系式推测其最可能的取值;b) 对可疑数据进行比较,这些数据虽然已经获得,但并不可靠,用关系式推测其可能取值,两者进行比较。【3】 回归的大致步骤1)分析数据之间的逻辑联系,找出因变量。友情提示:因
9、变量可能不只一个,挑选正确的因变量对于作正确的回归至关重要的;2)作相关系数分析,按照相关系数要做两件事:剔除与因变量相关系数小的自变量(小于0.4的放心先剔除_);如果有两个自变量之间的相关系数太大,则剔除与因变量相关系数小的那个;3)用剩下的数据作散点图,根据散点图确定变量之间的大致关系;4)确定回归公式:这完全依赖于你认为变量之间是什么关系,一般都是YaX1+bX2+cX3+d的形式,但有时也有d显然应该为0的情况,还可能有自变量应该相乘的情况,一定要注意数据之间的内在联系;5)分析主要参数:Significance F:回归模型是否显著,即所有自变量的总解释/预测力是否显著。换句话说,
10、就是还有没有至关重要的自变量没有包含进来,数值越小越好,应使其小于0.1;Significance F<0.1 ó 回归模型显著ó所有自变量的总解释/预测能力显著P value:个变量的增加有没有增加回归后的计算值与原值的接近程度,或者说对回归的贡献率,值越小越好,最好小于0.1;R2:我的理解就是回归后因变量的计算值与原值的相关性,如果只有一个自变量,R2的值就是和因变量的相关系数,一般来说应该大于0.7;残差:就是预测值和实际值的差值,看残差图时应着重看残差有没有规律性偏差,尤其是与时间相关性明显的情况;6)修正回归模型按照对上述参数的分析增加或减少自变量的数量P
11、 value太大: 减少相应自变量;Significance F太大:重新寻找未包含进来的重要自变量;R2太小:增加相关的自变量或改变回归模型;残差明显与时间相关:增加时间变量;7)应用回归得到的公式解决实际问题【4】 若干问题1)非线性回归:如果通过散点图看出自变量与因变量存在明显非线性关系,则需要进行非线性回归,具体操作很简单。如果认为回归后的公式中应该有二次项,就把自变量的观测值平方当成新的自变量作线性回归即可;2)多重共线性:所谓多重共线性,我的理解是两个自变量之间是相关的,一个可以用另一个来表示,也就是说其中一个是多余的。如果严格按照我上述步骤操作,应该不会担心这种情况,但也许有例外
12、。因此,需要注意的是:当我们发现有几个变量P value都很大时,千万不要急着大刀阔斧的砍掉,而是先作相关系数,相关系数高的几组数据中应该留下一组,与任何其它组数据相关系数都不高的(但P value很大)可以放心大胆的砍掉。3)哑变量的应用:即只取0和1两个值的变量4)自变量个数p和每组数据的个数n最好满足:5)预测区间不应超出回归区间太大,超出越大误差就可能越大1.6 规划求解【1】 作用:对一个由数个变量影响的问题在一定条件约束下按一定的决策标准进行优化,求出最优一组数值;【2】 规划求解的大致步骤1)分析简化问题找出需要决定的问题,并试着用决策变量来表示;2)建立决策模型,建模过程中必要
13、时可决策变量的设置;3)按照决策模型,确定目标函数;4)按照决策变量、决策模型确定限制条件;5)求解;6)分析求解结果。【3】 若干问题1)影子价格:在连续型线性优化的条件下,没有达到约束极限值的决策变量的影子价格是0,已达到约束极限值的决策变量的影子价格就是它每增加(或减少)一个单位给目标函数增加的值;在离散型线性优化的条件下,没有影子价格;在连续型非线性优化的条件下,已达到约束极限值的约束变量的影子价格就是目标函数微增量和决策变量的微增量的比值(相当于偏导数);2)当决策目标不只一个:这时通常的做法是,把其中一个设置成约束条件,另一个作为目标函数,进行求解(当然,可以改变约束条件的赋值,进行多次求解);然后把这两个颠倒,前面哪个作目标函数,后面那个作约束条件。2 案例&分析建议分三步走:(1) 到讨论区下载孙老师的复习讲义,文件名为Review.ppt,这个文件近900K。对本学期的所有概念、方法及主要案例做了精要的回顾与总结。(2) 到讨论区下载孙老师本学期的所有讲义PPT文件,仔细总结。(3) 再看看书上的案例。孙老师建议的复习方法:(1) (笔记PPT)>Knowledge;(2) 基础案例;(3) 苏笔利尔;小偷;8.1;8.2。3 应考策略(1) 考试时间:1
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年医师手术授权与管理试题
- 2025至2030年中国齿科树脂行业市场发展调研及投资前景分析报告
- 2025至2030年中国顺丁烯二酸行业发展策略分析及投资前景研究报告
- 2025至2030年中国长轴泵行业市场经营管理及投资策略研究报告
- 2025至2030年中国锂电池检测设备行业市场竞争现状及发展规划分析报告
- 2025至2030年中国铁皮石斛行业市场发展规模及投资机会分析报告
- 2025至2030年中国透平膨胀机行业市场现状调查及未来趋势研判报告
- 2025至2030年中国超声切割止血刀行业市场全景调查及投资策略研究报告
- 勇气教学课件
- 孟母断织劝学教学课件
- 2024年攀枝花市仁和区向招考社区工作者真题
- BIM在公路工程中的三维可视化应用-洞察阐释
- 离散数学考试题及答案
- 安徽省安庆望江县联考2025年七年级英语第二学期期中质量检测模拟试题含答案
- 2024-2025学年人教版数学一年级下学期期末模拟试卷(含答案)
- 安徽省合肥一中2025届高三最后一卷英语试题及答案
- 有关工厂实习心得体会模版
- 2025年组织行为学专业考试试题及答案
- 智能化汽车中的专利战略布局-洞察阐释
- 不寐的中医护理常规
- 天津市两学校2025届生物七下期末达标检测试题含解析
评论
0/150
提交评论