数学建模培训课程_第1页
数学建模培训课程_第2页
数学建模培训课程_第3页
数学建模培训课程_第4页
数学建模培训课程_第5页
已阅读5页,还剩214页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数学建模培训课程1.0数学素养1.1从现实对象到数学模型1.2数学建模的方法和步骤1.3数学模型的分类1.4数学建模能力的培养1.5关于建模竞赛一、基础知识概述1.0数学素养★“数学素养”的通俗说法是“把所学的数学知识都排除或忘掉后,剩下的东西”。例如,从数学角度看问题的出发点;有条理的思维,严密的思考、求证;简洁、清晰、准确的表达;在解决问题时、总结工作时,逻辑推理的意识和能力;对所从事的工作,合理的量化、简化,周到的运筹帷幄。一是主动寻求并善于抓住数学问题的背景和本质的素养;二是熟练地用准确、简明、规范的数学语言表达自己的数学思想的素养;三是具有良好的科学态度和创新精神,合理的提出新思想、新概念、新方法的素养;四是对各种问题以“数学方式”的理性思维,从多种角度探寻解决问题的方法的素养;五是善于对现实世界中的现象和过程进行合理的简化和量化,建立数学模型的素养。“数学素养”包含五点:1.1

从现实对象到数学模型原型和模型原型:指人们在现实世界里关心、研究或者从事生产、管理的实际对象。模型:为了某个特定目的将原型的某一部分信息检索、提炼而构造的原型替代物。也可以说模型是为了一定目的,对原型的主要特征进行简化、抽象得到的一个低代价近似替代物。玩具、照片、房屋模型……~实物模型地图、电路图、分子结构图……~符号模型你常见的模型需要强调的是:构造模型的目的性,模型不是原型原封不动的复制品,原型有各个方面和各种层次的特征,而模型只要求反映与某种目的有关的哪些方面和层次。模型的基本特征是由构造模型的目的决定的。

根据模型替代原型的方式可以对模型进行分类:模型形象模型抽象模型直观模型数学模型符号模型思维模型物理模型我们主要研究数学模型,那么,什么是数学模型呢?解:用x

表示船速,y表示水速,列出方程:答:船速每小时20千米/小时.甲乙两地相距750千米,船从甲到乙顺水航行需30小时,从乙到甲逆水航行需50小时,问船的速度是多少?x=20y=5求解你熟悉的数学模型——“航行问题”作出简化假设(船速、水速为常数);

用符号表示有关量(x,y表示船速和水速);

用物理定律(匀速运动的距离等于速度乘以时间)列出数学式子(二元一次方程);

求解得到数学解答(x=20,y=5);

用这个答案解释原问题(船速每小时20千米/小时,水速每小时20千米/小时);航行问题建立数学模型的基本步骤

最后还要用实际现象来验证上述结果。对于现实世界的一个特定对象,为了一个特定的目的,根据特有的内在规律,做出一些必要的简化假设,运用适当的数学工具,得到的一个数学结构。建立数学模型的全过程简称为数学建模或建模。数学模型(MathematicalModel)数学建模(MathematicalModeling)数学模型和数学建模数学建模:数学与实际问题的桥梁数学建模:应用数学知识解决实际问题的第一步数学建模:通常有本质性的困难和原始性的创新(关键一步)实际问题数学MathematicalModeling

数学建模的基本方法机理分析测试分析根据对客观事物特性的认识,找出反映内部机理的数量规律将对象看作“黑箱”,通过对量测数据的统计分析,找出与数据拟合最好的模型机理分析没有统一的方法,主要通过实例研究(CaseStudies)来学习。二者结合用机理分析建立模型结构,用测试分析确定模型参数1.2数学建模的方法和步骤模型准备模型假设模型构成模型求解模型分析模型检验模型应用数学建模的一般步骤模型准备了解实际背景明确建模目的搜集有关信息掌握对象特征形成一个比较清晰的‘问题’百度、谷歌、图书馆、书籍、维普、中国知网、统计局等数学建模的一般步骤模型假设针对问题特点和建模目的作出合理的、简化的假设在合理与简化之间作出折中模型构成用数学的语言、符号描述问题发挥想像力使用类比法尽量采用简单的数学工具数学建模的一般步骤模型求解各种数学方法、软件和计算机技术如结果的误差分析、统计分析、模型对数据的稳定性分析模型分析模型检验与实际现象、数据比较,检验模型的合理性、适用性模型应用数学建模的一般步骤数学建模的全过程现实对象的信息数学模型现实对象的解答数学模型的解答表述求解解释验证(归纳)(演绎)表述求解解释验证根据建模目的和信息将实际问题“翻译”成数学问题选择适当的数学方法求得数学模型的解答将数学语言表述的解答“翻译”回实际对象用现实对象的信息检验得到的解答实践现实世界数学世界理论实践1.3

数学模型的分类应用领域人口、交通、经济、生态……数学方法初等数学、最优化(规划)、微分差分方程、概率统计、图论……表现特性描述、优化、预报、决策……建模目的了解程度白箱灰箱黑箱确定和随机静态和动态线性和非线性离散和连续数学应用题与数学建模的区别数学应用题数学建模问题来源数学教学实际背景问题条件明确清晰不完全明确,需要作进一步了解或假设解决方法多种多种问题结论有标准答案有参考解答但无标准答案。不同的假设下有不同的模型和结论数学建模——技术+艺术技术大致有章可循艺术无法归纳成普遍适用的准则想像力洞察力判断力

学习、分析、评价、改进别人作过的模型

亲自动手,认真作几个实际题目1.4数学建模能力的培养需要:1、竞赛的指导思想2、历年试题3、竞赛中的题型特点4、论文的内容和格式5、参赛注意1.5关于建模竞赛1、数模竞赛的指导思想数模竞赛题是一个“课题”,大部分都源于生产实际或者科学研究的过程中,它是一个综合性的问题,数据庞大,需要用计算机来完成。其答案往往不是唯一的(数学模型是实际的模拟,是实际问题的近似表达,它的完成是在某种合理的假设下,因此其只能是较优的,不唯一的),呈报的成果是一编“论文”。2、历年试题1993年A题非线性交调的频率设计1993年B题球队排名问题1994年A题逢山开路1994年B题锁具装箱1995年A题一个飞行管理模型1995年B题天车与冶炼炉的作业调度1996年A题最优捕鱼策略1996年B题节水洗衣机1997年A题零件的参数设计1997年B题截断切割1998年A题投资的收益和风险1998年B题灾情巡视路线1999年A题自动化车床管理1999年B题钻井布局2000年A题DNA序列分类2000年B题钢管定购和运输2001年A题血管的三维重建2001年B题公交车调度2002年A题车灯线光源的优化设计2002年B题彩票中的数学2003年A题SARS的传播2003年B题露天矿生产的车辆安排2004年A题奥运会临时超市网点设2004年B题电力市场的输电阻塞管理2005年A题长江水质的评价和预测2005年B题DVD在线租赁2006年A题出版社的资源配置2006年B题艾滋病疗法的评价及疗效的预测2007年A题中国人口增长预测2007年B题乘公交,看奥运2008年A题数码相机定位2008年B题高等教育学费标准探讨2009年A题制动器试验台的控制方法2009年B题眼科病床的合理安排2010年A题储油罐的变位识别与罐容表标定2010年B题2010年上海世博会影响力的定量评估3、竞赛中的题型特点1).实际问题背景涉及面宽——有社会,经济,管理,生活,环境,自然现象,工程技术,现代科学中出现的新问题等。大体上可以分为工业、农业、工程设计、交通运输、经济管理、生物医学和社会事业等七个大类。

工业类:电子通信、机械加工与制造、机械设计与控制等行业,共有8个题,占28.6%。农业类:1个题,占3.6%。工程设计类:

3个题,占10.7%。交通运输类:3个题,占10.7%经济管理类:4个题,占14.3%生物医学类:4个题,占14.3%社会事业类:5个题,占17.8%

有的问题属于交叉的,或者是边缘的。2).若干假设条件1)只有过程、规则等定性假设;2)给出若干实测或统计数据;3)给出若干参数或图形;4)蕴涵着某些机动、可发挥的补充假设条件,或参赛者可以根据自己收集或模拟产生数据。3).要求回答的问题有几个问题,而且一般不是唯一答案。1)比较确定性的答案(基本答案);2)更细致或更高层次的讨论结果(往往是讨论最优方案的提法和结果)。4)、涉及的数学方法繁多

从问题的解决方法上分析,涉及到的数学建模方法有几何理论、组合概率、统计分析、优化方法、图论、网络优化、层次分析、插值与拟合、差分方法、微分方程、排队论、模糊数学、随机决策、多目标决策、随机模拟、灰色系统理论、神经网络、时间序列、综合评价方法、机理分析等方法。4、论文内容和格式1).标题题目——写出较确切的题目。2).摘要——200-300字,包括a.模型的数学归类(在数学上属于什么类型);b.建模的思想(思路);c.算法思想(求解思路);d.建模特点(模型优点,建模思想或方法,算法特点,结果检验,灵敏度分析,模型检验……);e.主要结果(数值结果,结论;回答题目所问的全部“问题”)。▲注意表述:准确、简明、条理清晰、合乎语法、字体工整漂亮。▲内容较多时最好有个目录。3).问题重述4).模型假设根据全国组委会确定的评阅原则,基本假设的合理性很重要。a.根据题目中条件作出假设b.根据题目中要求作出假设C.符合假设关键性假设不能缺;假设要切合题意。5).模型构建a.基本模型:ⅰ)首先要有数学模型:数学公式、方案等;ⅱ)基本模型,要求完整,正确,简明;b.简化模型:ⅰ)要明确说明简化思想,依据等;ⅱ)简化后模型,尽可能完整;c.模型要实用,有效,以解决问题有效为原则。数学建模面临的、要解决的是实际问题,不追求数学上的高(级)、深(刻)、难(度大)。ⅰ)能用初等方法解决的、就不用高级方法;ⅱ)能用简单方法解决的,就不用复杂方法;ⅲ)能用被更多人看懂、理解的方法,就不用只能少数人看懂、理解的方法。d.鼓励创新,但要切实,不要离题搞标新立异。数模创新可出现在:1.建模中,模型本身,简化的好方法、好策略等;2.模型求解中;3.结果表示、分析、检验,模型检验;4.推广部分。e.在问题分析推导过程中,需要注意的问题:ⅰ)分析:中肯、确切;ⅱ)术语:专业、内行;ⅲ)原理、依据:正确、明确;ⅳ)表述:简明,关键步骤要列出;ⅴ)忌:外行话,专业术语不明确,表述混乱,冗长。6).模型求解a.需要建立数学命题时:命题叙述要符合数学命题的表述规范,尽可能论证严密。b.要说明计算方法或算法的原理、思想、依据、步骤。若采用现有软件,说明采用此软件的理由,软件名称。

c.计算过程,中间结果可要可不要的,不要列出。d.设法算出合理的数值结果。7).结果分析、检验;模型检验及模型修正;结果表示a.最终数值结果的正确性或合理性是第一位的;b.对数值结果或模拟结果进行必要的检验;结果不正确、不合理、或误差大时,分析原因,对算法、计算方法、或模型进行修正、改进。c.题目中要求回答的问题,数值结果,结论,须一一列出;d.列数据问题:考虑是否需要列出多组数据,或额外数据.对数据进行比较、分析,为各种方案的提出提供依据;e.结果表示:要集中,一目了然,直观,便于比较分析。▲数值结果表示:精心设计表格;可能的话,用图形图表形式。▲求解方案,用图示更好。8).模型评价优点突出,缺点不回避。改变原题要求,重新建模可在此做。推广或改进方向时,不要玩弄新数学术语,没把握时,不要随便推广、改进。9.参考文献[1]武桃,张力.数学模型[M].北京:高等教育出版社,1960,45-49.[2]陆平.数学模型研究[J].数学的实践与认识,2010,2(5):12-18.[3]数学实验,.10).附录详细的结果,详细的数据表格,图表,算法程序,可在此列出,但不要错。主要结果数据,表格,应在正文中列出,不怕重复。5.参赛注意1.时间和体力的问题2.团队合作是能否获奖的关键3.重视摘要

4.论文写作要正规5.模型的假设与模型的建立6.图文表并茂可以增色

二、建模问题选讲艾滋病疗法的评价及疗效的预测全国大学生数学建模竞赛2006年B题

艾滋病是当前人类社会最严重的瘟疫之一,从1981年发现以来的20多年间,它已经吞噬了近3000万人的生命。艾滋病的医学全名为“获得性免疫缺损综合症”,英文简称AIDS,它是由艾滋病毒(医学全名为“人体免疫缺损病毒”,英文简称HIV)引起的。这种病毒破坏人的免疫系统,使人体丧失抵抗各种疾病的能力,从而严重危害人的生命。人类免疫系统的CD4细胞在抵御HIV的入侵中起着重要作用,当CD4被HIV感染而裂解时,其数量会急剧减少,HIV将迅速增加,导致AIDS发作。

艾滋病治疗的目的,是尽量减少人体内HIV的数量,同时产生更多的CD4,至少要有效地降低CD4减少的速度,以提高人体免疫能力。

迄今为止人类还没有找到能根治AIDS的疗法,目前的一些AIDS疗法不仅对人体有副作用,而且成本也很高。许多国家和医疗组织都在积极试验、寻找更好的AIDS疗法。现在得到了美国艾滋病医疗试验机构ACTG公布的两组数据。

ACTG320(见附件1)是同时服用zid.,lam.,ind.3种药物的300多名病人每隔几周测试的CD4和HIV的浓度(每毫升血液里的数量)。193A(见附件2)是将1300多名病人随机地分为4组,每组按下述4种疗法中的一种服药,大约每隔8周测试的CD4浓度(这组数据缺HIV浓度,它的测试成本很高)。4种疗法的日用药分别为:600mgzid.或400mgdid.,这两种药按月轮换使用;600mgzid.加2.25mgzal.;600mgzid.加400mgdid.;600mgzid.加400mgdid.,再加400mgnev.。请你完成以下问题:(1)利用附件1的数据,预测继续治疗的效果,或者确定最佳治疗终止时间(继续治疗指在测试终止后继续服药,如果认为继续服药效果不好,则可选择提前终止治疗)。(2)利用附件2的数据,评价4种疗法的优劣(仅以CD4为标准),并对较优的疗法预测继续治疗的效果,或者确定最佳治疗终止时间。

(3)艾滋病药品的主要供给商对不发达国家提供的药品价格如下:600mgzid.1.60美元,400mgdid.0.85美元,2.25mgzal.1.85美元,400mgnev.1.20美元。如果病人需要考虑4种疗法的费用,对(2)中的评价和预测(或者提前终止)有什么改变。附件1ACTG320数据同时服用3种药物的300多名病人每隔几周测试的CD4和HIV的浓度。第1列是病人编号,第2列是测试CD4的时刻(周),第3列是测得的CD4(乘以0.2个/ml),第4列是测试HIV的时刻(周),第5列是测得的HIV(单位不详)。PtID CD4DateCD4CountRNADate

VLoad23424 0 178 0 5.523424 4 228 4 3.923424 8 126 8 4.723424 25 171 25 42342440 99 40 523425 0 14 0 5.323425 4 62 4 2.423425 9 110 9 3.723425 23 122 23 2.623425 40 320 附件2193A数据1300多名病人按照4种疗法服药大约每隔8周测试的CD4浓度。第1列是病人编号,第2列是4种疗法的代码:第3列是病人年龄,第4列是测试CD4的时刻(周),第5列是测得的CD4,取值log(CD4+1).ID疗法年龄时间Log(CD4count+1)1 2 36.4271 0 3.13551 2 36.4271 7.5714 3.04451 2 36.4271 15.5714 2.77261 2 36.4271 23.5714 2.83321 2 36.4271 32.5714 3.21891 2 36.4271 40 3.04452 4 47.8467 0 3.06812 4 47.8467 8 3.89182 4 47.8467 16 3.97032 4 47.8467 23 3.61092 4 47.8467 30.7143 3.33222 4 47.8467 39 3.0910CD4大致有先增后减的趋势,HIV有先减后增的趋势,启示应建立时间的二次函数模型问题(1)利用附件1的数据,预测继续治疗的效果,或者确定最佳治疗终止时间。分析数据如随机取20个病人,画出他们CD4和HIV浓度随时间变化的图形(折线),若先用一次模型,应与二次模型做统计分析比较CD4HIV1)

总体回归模型

用全部数据拟合一个模型,如yij=b0+b1tij+b2tij2,tij,yij分别为第i病人第j次测量的时间和测量值(CD4或HIV)或者测量值与初始值之比,用数据估计b0,b1,b2建立模型有以下形式的回归模型(一次与二次模型比较,二次较优):对HIV,b2>0,b1<0,t=-b1/2b2达到最小对CD4,b2<0,b1>0,t=-b1/2b2达到最大平均地应在25~30(周)CD4达到最大,HIV达到最小,可以合理确定结束治疗时间。可对CD4统计b2i<0,b1i>0(存在正最大点)及b2i>0(不存在最大点)的频率,对HIV统计b2i>0,b1i<0(存在正最小点)及b2i<0(不存在最小点)的频率,分别作为及时结束治疗与继续治疗的概率(一般分别为0.6~0.8以及0.2~0.3);也可用它们的均值和均方差在确定分布下计算这些概率。2)个人回归模型用每个病人的数据拟合一个模型,如yij=b0i+b1itij+b2itij2,计算b0i,b1i,b2i的均值和均方差,用均值可得CD4的最大点和HIV的最小点,一般为20-30周。3)分段时序模型

对yij用j以前的资料如y(i,j-1),t(ij)-t(i,j-1),j-1段的斜率等为变量建立模型(j=3,4,5,6),由数据估计系数,预测yij,然后对CD4统计预测的yij大于实际的y(i,j-1)的频率,对HIV统计预测的yij小于实际的y(i,j-1)的频率,由此得到应终止治疗的时段。如果考虑病人初始状态(t=0时的CD4和HIV)的不同对模型的影响,可以将模型中的yij定义为第i病人第j次测量的CD4(或HIV)与初始值之差或之比。或者先按照病人初始状态分类(如轻度、中度、重度),然后对于每一类建立回归模型。建立模型几点注意:(1)建立几种模型相互比较、验证者较优。(2)不能只有模型,不做统计分析;对模型结果进行统计分析,考虑与数据拟合程度、注意去除异常数据者较优。(3)注意到有一些数据是当出现CD4下降、HIV上升就及时结束的,并做出适当考虑者较优。(4)注意到题目中“艾滋病治疗的目的,是尽量减少人体内HIV的数量,同时产生更多的CD4,至少要有效地降低CD4减少的速度”,并对结果做出适当考虑者较优。问题(2):利用附件2的数据,评价4种疗法的优劣,并对较优的疗法预测继续治疗的效果,或者确定最佳治疗终止时间。对于每种疗法随机取20个病人,画出他们CD4随时间变化的图形(折线),可以看出疗法1~3的CD4基本上水平,略有下降,而疗法4有先增后减的趋势。启示应建立时间的一次与二次函数模型,经统计分析比较,确定哪种较优。

分析数据1)可以引入4(或3)个0-1变量表示4种疗法建立统一模型,或者对每种疗法各建立一个模型(一般来说前者较优)。1.回归模型方法以总体回归模型为例,只需增加年龄变量,分别用一次与二次时间函数模型进行比较,可知疗法1~3用一次模型较优,且一次项系数为负,即CD4在减少,从数值看疗法3优于疗法2和1;疗法4用二次模型较优,即CD4先增后减,在t=20左右达到最大.建立模型做疗法有无显著性差异的两两比较:用1个0-1变量构造两种疗法的统一模型,可以用t检验作回归系数是否为零的假设检验。结果是疗法1与2无显著性差异,而疗法1与3,2与3,3与4均有显著性差异。2)假设检验疗法是必选的因素,如果还考虑年龄和初始状态,用双因素分析则比较复杂,可以先按这些因素分类,再做疗法的单因素分析。3)方差分析问题(3):如果病人需要考虑4种疗法的成本,对(2)中的评价和预测(或者提前终止)有什么改变。根据提供的价格疗法1~4每天的费用分别为:1.60(取最大),3.45,2.45,3.65,显然若经济允许应采用疗法4,否则可设定包含疗效和费用的决策函数,进行决策。论文中出现问题的评析1.只做数据拟合,不做统计检验。用回归分析方法做统计检验:得到的模型有无显著意义,它的置信度多大,用它作预测时准确程度如何。最小二乘拟合:已知一组数据(xk,yk),k=1,2,…,n和一个形式已定、参数

待定的模型(曲线)y=f(x,),确定参数使数据与模型在误差平方和最小的意义下拟合得最好。有现成的计算公式和软件确定参数x0123456789y1.041.221.381.591.801.992.212.392.652.83z0.280.612.192.562.491.173.171.292.113.27y=a1x+b1=0.2013x+1.0040z=a2x+b2=0.2025x+1.0025两个模型的结果一样,但是可靠性和准确性一样吗?需要做统计检验!简例最小二乘拟合yxzx决定系数R2F值p值剩余方差

2a的置信区间b的置信区间y=a1x+b10.99855294<0.00010.0006[0.1950,0.2077][0.9699,1.0381]z=a2x+b20.35284.3610.07020.7761[-0.0211,0.4262][-0.1915,2.1966]

R2=0.3528~在z的变化中只有35%是由x决定的

p值大于0.05~在常用的置信度

=5%下该模型没有显著意义

a2的置信区间包含零点~a=0落在置信水平为95%的区间内

若x=5.5预测区间y:[2.0621,2.1606],z:[0.3899,3.8432],预测值y=2.1113,z=2.1165回归分析结果z的预测没有什么价值!2.对原始数据先取平均,再用平均值做拟合数据中大多数病人的测试时间是0,4,8,…(周),个别病人是5,7,…(周),为了得到CD4(或HIV)的变化趋势,先在每个时间点上对CD4取平均,再用平均值做拟合.这样做有什么问题呢?注意:有的时间点上有上百个病人的CD4,而有的时间点上只有几个病人的CD4。

数据(x,y):x=0,y=0:0.05:2;

x=1,y=1:0.05:3;x=2,y=0,2,在图上共84个点。简例对数据(x,y)拟合一条直线,得y=0.7647x+1.0784先在x=0,1,2对y取平均得到3个点,再拟合直线,得y=1.3333取平均后的3个点在做拟合时的权重相同;但是x=0,1的点都是41个数据的平均值,而x=3的点只是2个数据的平均值3.拟合过度用4次、5次甚至更高次数的多项式作拟合数据的起伏是由与时间本身无关的其它随机因素引起的,不应该用增加时间的高次项来拟合注意拟合与插值在应用场合的差别一般地说,多项式拟合不要超过3次,对于本题如果用统计检验做显著性分析,可以发现多数情况是以时间的2次多项式为好适用本题的显然是拟合而非插值4.只按照图形做直观的定性判断,不做定量分析为了比较4种疗法的优劣,对每种疗法的CD4(或取平均)做散点图,或折线(散点连线)图,直观地比较疗法的优劣没有普遍的指导意义,对于其它问题或数据,这样做不一定能得到结果一种疗法的CD4散点图(或折线图)在另一种疗法的上面,从统计意义上并不能表明其显著性作为数学建模题目应该给出定量的处理方法!5.双指标处理不当对于CD4和HIV两个指标的处理,常用的方法是用某种函数形式将二者结合在一起.由于CD4越大越好,HIV越小越好,一些同学取二者之差或二者之商为综合指标.这样简单处理的问题在于,这两个指标量纲不同,数量级差别较大.恰当的办法是,先分别将其归一化(如将数值变换到0-1之间),然后取加权平均.一回归分析

在客观世界中,普遍存在着变量之间的相互关系。数学的重要作用就是从数量上来揭示、表达和分析这些关系。而变量之间的关系分为两类:

确定性关系-------即我们所熟悉的变量之间的函数关系,如圆的半径R与圆的面积S之间就存在确定的函数关系。

非确定性关系-------即变量之间虽然有密切的关系,但这种关系却无法用确定的函数关系表达,变量之间的这种非确定性关系,称为相关关系。例如:人的身高和体重的关系;人的血压和年龄的关系,某产品的广告投入与销售额的关系等。回归分析是研究两个或两个以上变量的相关关系的一种重要的统计方法。相关知识提要

具有相关关系的变量虽然不具有确定的函数关系,但是可以借助函数关系来表示它们之间的统计规律。这种近似地表示它们之间的相关关系的函数被称为回归函数。

最简单的情形是由两个变量形成的关系。考虑用下列模型表示:

但是由于两个变量之间不存在确定的函数关系,因此,必须把随即波动考虑进去,故引入模型如下:

回归分析就是根据已得的试验结果以及以往的经验来建立统计模型,并研究变量间的相关关系,建立起变量之间的近似表达式,并由此对相应的变量进行预测和控制。二、一元线性回归模型回归分析的主要内容(1)从一组数据出发,确定变量间的定量关系(回归模型);(2)对模型的可信度进行统计检验;(3)在有关的许多变量中,判断变量的显著性(即哪些是显著的,哪些是不显著的)从而决定保留哪些变量;(4)应用结果对实际问题做出判断和预测。10.1

牙膏的销售量

问题建立牙膏销售量与价格、广告投入之间的模型预测在不同价格和广告费用下的牙膏销售量收集了30个销售周期本公司牙膏销售量、价格、广告费用,及同期其它厂家同类牙膏的平均售价9.260.556.804.253.70307.930.055.803.853.8029

8.510.256.754.003.7527.38-0.055.503.803.851销售量(百万支)价格差(元)广告费用(百万元)其它厂家价格(元)本公司价格(元)销售周期MATLAB统计工具箱

模型求解[b,bint,r,rint,stats]=regress(y,x,alpha)

输入

x=~n

4数据矩阵,第1列为全1向量alpha(置信水平,0.05)

b~

的估计值bint~b的置信区间r~残差向量y-xb

rint~r的置信区间Stats~检验统计量

R2,F,p

y~n维数据向量输出

由数据y,x1,x2估计

参数参数估计值置信区间17.3244[5.728228.9206]1.3070[0.68291.9311]-3.6956[-7.49890.1077]0.3486[0.03790.6594]R2=0.9054F=82.9409p=0.0000

0

1

2

3结果分析y的90.54%可由模型确定参数参数估计值置信区间17.3244[5.728228.9206]1.3070[0.68291.9311]-3.6956[-7.49890.1077]0.3486[0.03790.6594]R2=0.9054F=82.9409p=0.0000

0

1

2

3F远超过F检验的临界值p远小于

=0.05

2的置信区间包含零点(右端点距零点很近)x2对因变量y的影响不太显著x22项显著可将x2保留在模型中模型从整体上看成立彩票中的数学问题全国大学生数学建模竞赛2002年B题

彩票中的数学问题2002高教社杯全国大学生数学建模竞赛B题

近年来“彩票飓风”席卷中华大地,巨额诱惑使越来越多的人加入到“彩民”的行列,目前流行的彩票主要有“传统型”和“乐透型”两种类型。

“传统型”采用“10选6+1”方案:先从6组0~9号球中摇出6个基本号码,每组摇出一个,然后从0~4号球中摇出一个特别号码,构成中奖号码。投注者从0~9十个号码中任选6个基本号码(可重复),从0~4中选一个特别号码,构成一注,根据单注号码与中奖号码相符的个数多少及顺序确定中奖等级。以中奖号码“abcdef+g”为例说明中奖等级,如表1所示(X表示未选中的号码)。一.问题的提出

表1中

奖等

级10选

6+1(6+1/10)

特别号码说

明一等奖Abcdefg选7中(6+1)二等奖abcdef

选7中(6)三等奖abcdeX

Xbcdef

选7中(5)四等奖abcdXX

XbcdeX

XXcdef选7中(4)五等奖abcXXX

XbcdXX

XXcdeX

XXXdef

选7中(3)六等奖abXXXX

XbcXXX

XXcdXX

XXXdeX

XXXXef

选7中(2)

“乐透型”有多种不同的形式,比如“33选7”的方案:先从01~33个号码球中一个一个地摇出7个基本号,再从剩余的26个号码球中摇出一个特别号码。投注者从01~33个号码中任选7个组成一注(不可重复),根据单注号码与中奖号码相符的个数多少确定相应的中奖等级,不考虑号码顺序。又如“36选6+1”的方案:先从01~36个号码球中一个一个地摇出6个基本号,再从剩下的30个号码球中摇出一个特别号码。投注者从01~36个号码中任选7个组成一注(不可重复),根据单注号码与中奖号码相符的个数多少确定相应的中奖等级,不考虑号码顺序。这两种方案的中奖等级如表2所示。

表2中

奖等

级33选

7(7/33)36选

6+1(6+1/36)基

特别号码说

明基

特别号码说

明一等奖●●●●●●●选7中(7)●●●●●●★选7中(6+1)二等奖●●●●●●○

★选7中(6+1)●●●●●●

选7中(6)三等奖●●●●●●○选7中(6)●●●●●○★选7中(5+1)四等奖●●●●●○○★选7中(5+1)●●●●●○选7中(5)五等奖●●●●●○○选7中(5)●●●●○○★选7中(4+1)六等奖●●●●○○○★选7中(4+1)●●●●○○选7中(4)七等奖●●●●○○○选7中(4)●●●○○○★选7中(3+1)注:●为选中的基本号码;★为选中的特别号码;○为未选中的号码。

以上两种类型的总奖金比例一般为销售总额的50%,投注者单注金额为2元,单注若已得到高级别的奖就不再兼得低级别的奖。现在常见的销售规则及相应的奖金设置方案如表三,其中一、二、三等奖为高项奖,后面的为低项奖。低项奖数额固定,高项奖按比例分配,但一等奖单注保底金额60万元,封顶金额500万元,各高项奖额的计算方法为:

[(当期销售总额×总奖金比例)-低项奖总额]×单项奖比例(1)根据这些方案的具体情况,综合分析各种奖项出现的可能性、奖项和奖金额的设置以及对彩民的吸引力等因素评价各方案的合理性。(2)设计一种“更好”的方案及相应的算法,并据此给彩票管理部门提出建议。(3)给报纸写一篇短文,供彩民参考。表三序号方案一等奖比例二等奖比例三等奖比例四等奖金额五等奖金额六等奖金额七等奖金额备注16+1/1050%20%30%50按序26+1/1060%20%20%300205按序36+1/1065%15%20%300205按序46+1/1070%15%15%300205按序57/2960%20%20%30030566+1/2960%25%15%20020577/3065%15%20%5005015587/3070%10%20%2005010597/3075%10%15%20030105107/3160%15%25%500502010奖项117/3175%10%15%320305127/3265%15%20%5005010137/3270%10%20%5005010147/3275%10%15%5005010157/3370%10%20%600606167/3375%10%15%50050105177/3465%15%20%500306187/3468%12%20%50050102197/3570%15%15%300505207/3570%10%20%500100305217/3575%10%15%1000100505227/3580%10%10%20050205237/35100%20002042无特别号246+1/3675%10%15%500100105256+1/3680%10%10%50010010267/3670%10%20%50050105277/3770%15%15%150010050286/4082%10%8%200101295/6060%20%20%30030评价一个方案的优劣,或合理性如何,主要取决于彩票公司和广大彩民两方面的利益。事实上,公司和彩民各得销售总额的50%是确定的,双方的利益主要就取决于销售总额的大小,即双方的利益都与销售额成正比。因此,问题是怎样才能有利于销售额的增加?即公司采用什么样的方案才能吸引广大的彩民积极踊跃购买彩票?具体地讲,问题涉及到一个方案的设置使彩民获奖的可能性有多大、奖金额有多少、对彩民的吸引力有多大、广大彩民如何看待各奖项的设置,即彩民的心理曲线怎样?另外,一个方案对彩民的影响程度可能与区域有关,即与彩民所在地区的经济状况以及收入和消费水平有关。为此,我们要考查一个方案的合理性问题,需要考虑以上这些因素的影响,这是我们建立模型的关键所在。二、模型分析三、模型假设与符号说明

1.彩票每期的中奖号码都是随机产生的不受外界的任何因素的影响,彩票摇奖是公平公正的。2.彩票发行单位每期拿出本期销售额的50%作为奖金发入奖金池中。3.“传统型”彩票选择的号码中的数字是可以重复的且号码是有顺序,不同的投注者选择的号码可以相同(因此一等奖可能有多个中奖者)。4.“乐透型”彩票选择的号码中的数字是不可以重复的且号码是无顺序,不同的购买者选择的号码可以相同(因此一等奖可能有多个中奖者)。5.若单注已得到高级别的奖就不再兼得低级别的奖。6.按问题中的高项奖计算公式计算奖金额,当某期的一等奖的金额低于60万时,不足的金额由彩票销售公司补足;当计算出的某期的一等奖的金额高于500万时,公司也只将一等奖金额定为500万。9.彩民购买彩票是随机的独立事件;10.对同一方案中高级别奖项的奖金比例或奖金额不应低于相对低级别的奖金比例或奖金额;11.根据我国的现行制度,假设我国居民的平均工作年限为T=35年。

7.

彩票销售规则及相应的奖金设置方案在一定的时期内是固定不变的。

8.一、二、三等奖规定为高项奖,其余的规定为低项奖;低项奖数额固定,高项奖按比例分配,高项奖额的计算方法为:

[(当期销售总额总奖金比例)-低项奖总额]单项奖比例。---第等(高项)奖占高项奖总额的比例,J=1,2,3;----第等奖奖金额均值,;----彩民中第等奖的概率,;

----彩民对某个方案第等奖的满意度,即第等奖对彩民的吸引力,;

----某地区的平均收入和消费水平的相关因子,称为“实力因子”,一般为常数;

----彩票方案的合理性指标,即方案设置对彩民吸引力的综合指标;

四、模型的准备

(1)彩民获各项奖的概率从已给的29种方案可知,可将其分为四类,

分别给出各种类型方案的彩民获各奖项的概率公式:“传统型”:先从6组0~9号球中摇出6个基本号码,每组摇出一个,然后从0~4号球中摇出一个特别号码,构成中奖号码。投注者从0~9十个号码中任选6个基本号码(可重复),从0~4中选一个特别号码,构成一注,中

奖等

级10选

6+1(6+1/10)

特别号码说

明一等奖Abcdefg选7中(6+1)中

奖等

级10选

6+1(6+1/10)

特别号码说

明二等奖abcdef

选7中(6)中

奖等

级10选

6+1(6+1/10)

特别号码说

明三等奖abcdeX

Xbcdef

选7中(5)中

奖等

级10选

6+1(6+1/10)

特别号码说

明四等奖abcdXX

XbcdeX

XXcdef选7中(4)中

奖等

级10选

6+1(6+1/10)

特别号码说

明五等奖abcXXX

XbcdXX

XXcdeX

XXXdef

选7中(3)

奖等

级33选

7(7/33)基

特别号码说

明一等奖●●●●●●●选7中(7)中

奖等

级33选

7(7/33)基

特别号码说

明二等奖●●●●●●○

★选7中(6+1)中

奖等

级33选

7(7/33)基

特别号码说

明三等奖●●●●●●○选7中(6)中

奖等

级33选

7(7/33)基

特别号码说

明四等奖●●●●●○○★选7中(5+1)中

奖等

级33选

7(7/33)基

特别号码说

明五等奖●●●●●○○选7中(5)中

奖等

级33选

7(7/33)基

特别号码说

明六等奖●●●●○○○★选7中(4+1)中

奖等

级33选

7(7/33)基

特别号码说

明七等奖●●●●○○○选7中(4)

乐透型”:先从n个号码球中一个一个地摇出m个基本号,再从剩余的n-m个号码球中摇出一个特别号码。投注者从n个号码中任选m个组成一注(不可重复),中

奖等

级36选

6+1(6+1/36)基

特别号码说

明一等奖●●●●●●★选7中(6+1)中

奖等

级36选

6+1(6+1/36)基

特别号码说

明二等奖●●●●●●

选7中(6)中

奖等

级36选

6+1(6+1/36)基

特别号码说

明三等奖●●●●●○★选7中(5+1)中

奖等

级36选

6+1(6+1/36)基

特别号码说

明四等奖●●●●●○选7中(5)中

奖等

级36选

6+1(6+1/36)基

特别号码说

明五等奖●●●●○○★选7中(4+1)中

奖等

级36选

6+1(6+1/36)基

特别号码说

明六等奖●●●●○○选7中(4),,,,

各种方案的各个奖项获奖概率及获奖总概率中

奖等

级33选

7(7/33)基

特别号码说

明一等奖●●●●●●●选7中(7)中

奖等

级33选

7(7/33)基

特别号码说

明二等奖●●●●●●○

选7中(6)中

奖等

级33选

7(7/33)基

特别号码说

明三等奖●●●●●○○选7中(5)中

奖等

级33选

7(7/33)基

特别号码说

明四等奖●●●●○○○

选7中(4)表一:方案6+1/102×10-78×10-71.8×10-52.61×10-43.42×10-34.1995×10-2-----0.0456957/296.40705×10-74.48494×10-69.4184×10-52.8255×10-42.8255×10-34.7092×10-30.0298250.0377426+1/296.40705×10-71.4096×10-58.4573×10-58.8880×10-42.2200×10-31.4800×10-20.0197340.0377427/304.91207×10-73.43845×10-67.5646×10-52.2694×10-42.3828×10-33.9714×10-30.0264760.0331377/313.80290×10-72.66203×10-66.1227×10-51.8368×10-42.0205×10-33.3675×10-30.0235720.0292087/322.97101×10-72.07971×10-64.09913×10-51.4974×10-41.722×10-32.8700×10-30.0210470.0258327/332.34080×10-71.63856×10-64.0964×10-51.2289×10-41.4747×10-32.4578×10-30.0188430.0229417/341.85887×10-71.30121×10-63.3831×10-51.0149×10-41.2687×10-32.1145×10-30.0169160.0204367/351.48709×10-71.04097×10-62.8106×10-58.4318×10-51.0961×10-31.8269×10-30.0152240.018261计算结果:7/361.19794×10-78.38556×10-72.3480×10-57.0439×10-59.5092×10-41.5849×10-30.0137360.0163676+1/361.19794×10-73.47402×10-62.0844×10-52.9182×10-47.2954×10-46.5659×10-30.0087550.0163677/379.71301×10-86.79911×10-71.9717×10-55.9152×10-58.2813×10-41.3802×10-30.0124220.0147106/402.6053×10-71.5632×10-65.1584×10-51.2896×10-42.0634×10-32.7512×10-30.0284280.0334255/601.831×10-79.155×10-74.9437×10-59.8874×10-52.6202×10-32.6202×10-30.0454160.050806一般说来,人们的心理变化是一个模糊的概念。在此,彩民对一个方案的各个奖项及奖金额的看法(即对彩民的吸引力)的变化就是一个典型的模糊概念。由模糊数学隶属度的概念和心理学的相关知识,根据人们通常对一件事物的心理变化一般遵循的规律,不妨定义彩民的心理曲线为表示彩民平均收入的相关因子,称为实力因子,一般为常数。

(2)确定彩民的心理曲线(3)计算实力因子实力因子是反应一个地区的彩民的平均收入和消费水平的指标,确定一个地区的彩票方案应该考虑所在地区的实力因子,在我国不同地区的收入和消费水平是不同的,因此,不同地区的实力因子应有一定的差异,目前各地区现行的方案不尽相同,要统一来评估这些方案的合理性,就应该对同一个实力因子进行研究。为此,我们以中等地区的收入水平(或全国平均水平)为例进行研究。根据相关网站的统计数据,不妨取人均年收入1.5万元,按我国的现行制度,平均工作年限T=35年,则人均总收入为52.5万元,万元时,取(即吸引力的中位数),则有。于是,当同理,可以算出年收入1万元、2万元、2.5万元、3万元、4万元、5万元、10万元的实力因子如表二。

表二:年收入指标1万元1.5万元2万元2.5万元3万元4万元5万元10万元42039363058984078610509821261179168157121019644203928五.模型的建立与求解问题(一)要综合评价这些方案的合理性,应该建立一个能够充分反应各种因素的合理性指标函数。因为彩民购买彩票是一种风险投资行为,为此,我们根据决策分析的理论,考虑到彩民的心理因素的影响,可取为风险决策的益损函数,于是作出如下的指标函数

(1)即表示在考虑彩民的心理因素的条件下,一个方案的奖项和奖金设置对彩民的吸引力。另一方面,由题意知,单注所有可能的低项奖金总额为,根据高项奖的计算公式得单注可能的第j

项(高项奖)奖金额为故平均值为(2)于是由(1),(2)式得

(3)利用Matlab可计算出29种方案的合理性指标值F及高项奖的期望值,排在前三位的如下表三。

表三:

指标

方案排序97/304.009×10-71.086×1062067914101117/313.784×10-71.704×106324482116257/293.637×10-77.557×1053598417143问题(二)

根据问题(一)的讨论,现在的问题是取什么样的方案m/n(n和m取何值)、设置哪些奖项、高项奖的比例为多少和低项奖的奖金额为多少时,使目标函数

有最大值。为决策变量,以它们之间所满足的关系为约束条件,则可得到非线性规划模型:

关于约束条件的说明:1.条件(1)(2)同问题(一);2.条件(3)(4)是对高项奖的比例约束,的值不能太大或太小,(4)是根据已知的方案确定的;

3.条件(5)是根据题意中一等奖的保底额和封顶额确定的;

4.条件(6)中的分别为i等奖的奖金额计算结果和已知各方案的奖金数额统计得:

高的倍数,可由问题(一)的5.条件(7)是根据实际问题确定的,实际中高等奖的概率

,它的值主要由m,n确定。6.条件(8)(9)是对方案中m,n取值范围的约束,是由已知的方案确定的;这是一个较复杂的非线性(整数)规划,其中概率的取值分为四种不同的情况且由整数变量m,n确定,一般的求解是困难的。为此,利用Matlab可求解得最优解为最优值为故对应的最优方案为:32选6(6/32),一、二、三等奖的比例分别为80%、9%、11%,四、五、六、七等奖的金额分别为200、10、1、0元。前面是针对中等收入水平的彩民情况考虑的,对于经济发达地区和欠发达地区应有所不同。这里分别对年收入1万元、2万元、2.5万元、3万元、4万元、5万元、10万元,工作年限均35年的情况进行了讨论,给出适用于相应各种情况的最优方案,如下面的表四。表四:年收入指标1万元2万元2.5万元3万元4万元5万元10万元42039384078610509821261179168157121019644203928最优方案5+1/336/327/306/376+1/327/337/358.255×10-74.623×10-74.103×10-73.223×10-72.475×10-72.075×10-71.828×10-70.800.800.730.700.730.730.800.100.90.170.150.190.180.130.100.110.100.150.070.090.076.5×1056.18×1051.38×1061.46×1062.23×1062.99×1063.91×10630371200044750652172227211.07×1059425260760012351739150719741746138200100200100200103710102020102011522250000003问题(三)(略)说明:

(1)研究此问题必须要考虑心理曲线,但心理曲线的可能会有不同的形式,主要是看对问题解释是否合理,实力因子在不同地区可以取不同的值,对方案的评判结果也会有差别。(2)问题的合理性指标函数的一定与心理曲线有关,但应该在风险决策的意义下确定出益损函数,益损函数的确定不是唯一的。(3)问题中的概率公式的形式应该是唯一的。参考文献中国彩票网:http://排队论问题排队论(Queuingtheory),又称随机服务系统,是通过研究各种服务系统在排队等待现象中的概率特性,解决服务系统最优设计与最优控制的一种理论。(一)、排队论的基本概念

1、综述排队系统的例子

顾客要求的服务服务台1.借书的学生2.打电话3.提货者4.待降落的飞行器5.储户6.河水进入水库7.购票旅客8.十字路口的汽车借书通话提货降落存款、取款放水、调整水位购票通过路口图书管理员交换台仓库管理员指挥塔台

储蓄窗口、ATM取款机水库管理员售票窗口红绿灯或交警由“服务台”和“顾客”构成了服务系统。当“服务台”繁忙时,“顾客”就必须排队等待或暂时离去,或者放弃服务。由于顾客到来时刻与服务时间都是随不同的时机和条件而变化,因此服务系统的状态也呈现出随机性。一般说来,服务系统大都是随机服务系统。这里必须说明的是,排队的“顾客”要作广义理解,它可以是人,也可以是物。增加服务设施可以减少等待时间,但服务成本也会提高,而减少服务设施,则可以减少开支,但却增加了等待时间。如何把等待时间转化为费用与服务成本进行比较,从而找出最佳方案,目前尚未很好解决。而排队论主要是利用分析、研究排队过程几个数量指标,对服务系统进行分析,提供有关单位参考、决策,进一步探讨最优化问题。排队的过程可表示为:顾客到达排队接受服务顾客离去服务系统输出输入排队系统由输入过程、排队规则和服务台三个部分组成1.输入过程描述要求服务的顾客按怎样的规律到达排队系统的过程,有时也称之为顾客流。可以从下面三个方面来刻画:(1)顾客总体数,又称顾客源、输入源。顾客源可以是有限的,也可以是无限的。如来商场购物的顾客数量可以认为是无限的,车间内待修的机器显然是有限的。(二)、排队系统的基本组成(2)顾客到达的形式。这是描述顾客是怎样来到系统的,是单个到达,还是成批到达。如货品成批进入仓库。(3)顾客流的概率分布,或称顾客相继到达的时间间隔分布。这是首先需要确定的指标。令T0=0,Tn表示第n个顾客到达的时间,则有T0≤T1≤…≤Tn≤…,记Xn

=Tn

-Tn-1,n=1,2,…,则Xn是第n个顾客与第n-1个顾客到达的时间间隔。一般地,假设{Xn}是独立同分布的。关于{Xn}的分布(顾客流的概率分布),在排队论中经常用到的有定长分布、负指数分布、爱尔朗分布等等。2.排队规则主要是描述服务机构是否允许顾客排队,顾客对排队长度、时间和容忍程度以及在排队队列中等待服务的顺序。常见的排队规则有如下几种情形:(1)损失制指当顾客到达系统时,所有服务台都已被占用,顾客不愿等待而离开系统。例如,某些电话系统可以看作是损失制排队系统。(2)等待制指顾客到达系统后,所有服务台都不空,顾客加入排队行列等待服务,一直等到服务完毕以后才离去;①先到先服务(FIFO,FirstInFirstOut);②后到先服务(LIFO,LastInFirstOut);③有优先权的服务(PS,PriorityService)④随机服务(RS,RandomService)(3)混合制这是等待制与损失制相结合的一种服务规则,一般是指允许排队,但又不允许队列无限长下去。大体有以下三种:①队长有限。当等待服务的顾客人数超过规定数量时,后来的顾客就自动离去,另求服务,即系统的等待空间是有限的。如旅馆的床位是有限的。②等待时间有限。即顾客在系统中的等待时间不超过某一给定的长度T,当等待时间超过时间T时,顾客将自动离去,并不再回来。如易损坏的电子元器件的库存问题,超过一定存储时间的元器件被自动认为失效。③逗留时间(等待时间与服务时间之和)有限。例如,用高射炮射击敌机,当敌机飞越高射炮射击有效区域的时间为t时,若在这个时间内未被击落,也就不可能再被击落了。损失制和等待制可以看成是混合制的特殊情形。如记s为系统中服务台的个数,K为系统的容量(即系统只能容纳K个顾客),则当K=s时,混合制即为损失制;当K=∞时,即为等待制。3.服务台(也称为服务机构)服务台可以从以下三个方面来描述:(1)服务台数量及构成形式从数量上说,服务台有单台和多台之分。从构成形式上看,有单队单服务台式、单队多服务台并联式、单队多服务台串联式\多队多服务台并联式等等;…顾

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论