数学建模方法之概率统计分析法_第1页
数学建模方法之概率统计分析法_第2页
数学建模方法之概率统计分析法_第3页
数学建模方法之概率统计分析法_第4页
数学建模方法之概率统计分析法_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数学建模方法之概率统计分析法第1页,共41页,2023年,2月20日,星期六主成分分析因子模型马氏链模型统计回归模型排队论模型概率模型第2页,共41页,2023年,2月20日,星期六第一篇主成分分析在实际经济工作中,我们经常碰到多变量或多指标问题,例如,企业经济效益的评价,地区经济发展情况比较。由于变量或指标较多,且变量或指标之间存在一定的相关性,人们自然希望用较少的变量或指标代替原来较多的变量或指标,而且可尽量保存原有信息,利用这种降维的思想产生了主成分分析方法第3页,共41页,2023年,2月20日,星期六主成分分析法:就是设法将原来的具有一定相关性的变量或者指标,重新组成一组新的相互无关的少数几个综合变量或指标,以此代替原来的变量或指标。简单的说就是降维。应用:综合评价(系统评估)第4页,共41页,2023年,2月20日,星期六例:对我国上市公司的经济效益进行综合评判。

上市公司资金利税率x1产值利税率x2百元销售成本利润x3百元销售收入利税x4流动资金周转次数x5主营利润增长率x6qinghua5.418.052.092.431.307.51beida7.218.544.515.261.4310.44hualian8.389.524.275.071.7010.49xinya6.319.973.634.591.297.21yanzhong8.971.431.731.181.105.22shuiyun3.746.470.330.390.985.24cengxin3.635.79-1.09-1.291.174.71qingshan14.475.977.621.371.2010.56pudong8.188.203.414.011.7512.13第5页,共41页,2023年,2月20日,星期六主成分分析步骤:1.将数据标准化,标准化后的数据矩阵仍记X阵。2.求矩阵X的相关系数阵3.求R的全部特征根i及相应的特征向量()。4.根据前k个主分量累计贡献率大小(∑),确定主成分(因子)个数。根据具体指标内容和指标变量系数大小解释主成分含义。用每个主成分的贡献率作权数,给出多指标综合评价值。第6页,共41页,2023年,2月20日,星期六

EigenvaluesoftheCorrelationMatrixEigenvalueDifferenceProportionCumulative14.047670163.037348020.67460.674621.010322140.302483690.16840.843030.707838450.553001900.11800.961040.154836550.100373280.02580.986850.054463270.029593850.00910.995960.024869420.00411.0000第7页,共41页,2023年,2月20日,星期六第8页,共41页,2023年,2月20日,星期六ObsPrin1Prin2Prin3Prin4Prin5Prin61-0.38118-0.32367-0.044500.303630.004300.0643720.57795-0.354160.492790.55119-0.187260.1741430.69219-0.215880.405570.40041-0.104610.0539340.22635-0.394190.275210.632960.13851-0.064815-0.82981-0.402930.47330-0.42964-0.55401-0.350206-1.19410-0.40627-0.368480.140000.022210.010637-1.63568-0.26394-0.67179-0.151890.01702-0.0376980.95195-0.461561.61851-0.925200.083940.2553090.46501-0.148880.190700.16273-0.303270.2088310-1.45693-0.18670-0.55658-0.17088-0.10267-0.0092211-0.294013.71727-0.02727-0.02382-0.064190.03517120.080410.225421.716940.127180.45539-0.2666813-2.11628-0.16312-0.90179-0.167840.14422-0.0333414-0.94513-0.31477-0.395130.097600.11375-0.03132156.74015-0.06989-1.12895-0.166180.04080-0.1139416-0.88090-0.23673-1.07853-0.380250.295890.10482第9页,共41页,2023年,2月20日,星期六用于系统评估的方法:关键问题是如何科学的客观地将一个多指标问题转化为单指标问题第一种方法:用第一主成分得分y=F1.

必须要求:所有系数均为正第二种方法:将主成分F1,F2,Fm进行线性组合,系数为方差贡献率第10页,共41页,2023年,2月20日,星期六

yidiyizhuchengfenpaixv13:30Saturday,July17,199935

namePrin1x1x2x3x4x5x6

laigang-2.116282.175.70-2.11-2.571.343.21cengxin-1.635683.635.79-1.09-1.291.174.71xinbai-1.456934.275.35-0.71-0.831.385.68shuiyun-1.194103.746.470.330.390.985.24guangsha-0.945134.657.800.530.651.185.82chanhong-0.880905.6510.63-0.92-1.191.088.84yanzhong-0.829818.971.431.731.181.105.22Qinghua-0.381185.418.052.092.431.307.51guoji-0.294018.078.690.730.8910.7510.16zonghang0.080419.666.276.692.633.051.64xinya0.226356.319.973.634.591.297.21pudong0.465018.188.203.414.011.7512.13beida0.577957.218.544.515.261.4310.44hualian0.692198.389.524.275.071.7010.49qingshan0.9519514.475.977.621.371.2010.56xiaxin6.7401525.9533.526.9615.381.5136.89

第11页,共41页,2023年,2月20日,星期六统计软件SAS(关于主成分分析)数据的输入(介绍两种方法)

data数据名(haimen);inputname$x1x2x3x4x5x6;card;qinghua50122run;

外部文件转化为SAS数据集:已知c盘根目录下文件名test.dat为的数据文件张三男82956478data数据名(chengji);infile‘c:\test.dat’;inputname$sex$chinesemathsenglishchemisty;run;

第12页,共41页,2023年,2月20日,星期六主成分分析Procprincompn=6out=out1;varx1-x6;run;procprintdata=out1;varprin1-prin6;run;第13页,共41页,2023年,2月20日,星期六数据预处理一致性处理:越大越差、越大越好归一化处理(去量纲):

(x-max(xi))/极差,x/max(xi),

标准化处理(x-均值)/方差第14页,共41页,2023年,2月20日,星期六第二篇因子模型因子分析是统计中一种重要的分析方法,他的主要特点在于能探索不易观测或不能观察的潜在因素。它在社会调查、气象、地质等方面有广泛应用。第15页,共41页,2023年,2月20日,星期六若有n个学生,每个学生考五门课,考试成绩反映了学生的素质和能力,理解能力,逻辑能力,记忆能力,对文字符号概念的反应速度,能否从学生的学习成绩去寻找出反映这些能力的量。第16页,共41页,2023年,2月20日,星期六因子模型为:其中:为原指标,称为的公共因子或潜因子,为的特殊因子可将上式写成矩阵表示形式:称为因子载荷阵

第17页,共41页,2023年,2月20日,星期六因子分析步骤:前四步骤与主成分步骤相同,在此略。5.求初始因子载荷阵A。6.若公因子的含义不清楚,不便于实际解释时,将初始因子阵作旋转处理,直到达到要求。7.根据因子载荷大小说明因子具体含义。将因子表示成原指标变量线性组合,估计因子得分。用每个因子的贡献率作权数,给出多指标综合评价值。第18页,共41页,2023年,2月20日,星期六因子载荷阵的统计意义模型中载荷矩阵中的元素称为因子载荷。因子载荷是与的协方差,也是与的相关系数,它表示依赖的程度。可将看作第i个变量在第j个公共因子上的权,的绝对值越大,表明与的相依程度越大,或称公共因子对于的载荷量越大。为了得到因子分析结果的经济解释,因子载荷矩阵A中有两个统计量十分重要,即变量共同度和公共因子的方差贡献。第19页,共41页,2023年,2月20日,星期六变量共同度因子载荷矩阵中第i行元素之平方和记为,即,称为变量的共同度。它是全部公共因子对的方差所做出的贡献,反映了全部公共因子对变量的影响。越大表明对于F的每一分量的共同依赖程度大。第20页,共41页,2023年,2月20日,星期六

公共因子的方差贡献将因子载荷矩阵的第j列的各元素的平方和记为,即,称为公共因子对x的方差贡献。就表示第j个公共因子对于的每一分量所提供方差的总和,它是衡量公共因子相对重要性的指标。越大,表明公共因子对x的贡献越大,如果将因子载荷矩阵的所有都计算出来,使其按照大小排序,就可以依此提炼出最有影响力的公共因子。第21页,共41页,2023年,2月20日,星期六因子载荷阵A(主成分法)一般设为样本相关阵R的特征根,为对应的标准正交化特征向量。则因子载荷阵A的一个解为:

第22页,共41页,2023年,2月20日,星期六因子旋转建立因子分析模型的目的不仅是找出主因子,更重要的是知道每个公共因子的意义,以便对实际问题进行分析。如果求出主因子解后,各个主因子的典型代表变量不很突出,我们就可以利用因子载荷阵的不唯一性这一特点对得到的因子模型进行旋转使得变换后的公共因子和载荷阵有明显的实际意义。最常用的方法是最大方差正交旋转法(Varimax)。进行因子旋转,就是要使因子载荷矩阵中因子载荷的平方值向0和1两个方向分化,使大的载荷更大,小的载荷更小。接近于1的表明公因子与的相关性很强,在很大的程度上解释了的变化;接近于0的表明与的相关性很弱。。第23页,共41页,2023年,2月20日,星期六例:对我国上市公司的经济效益进行因子分析Procfactormethod=principaln=2rotate=varinmaxall;Varx1-x6;Run;第24页,共41页,2023年,2月20日,星期六Factor1=0.95056x1+0.89158x2+0.75108x3+0.9565x4+0.24829x5+0.9247x6Factor2=0.0091x1-0.30529x2+0.49587x3-0.01446x4+0.89379x5-0.34281x6第25页,共41页,2023年,2月20日,星期六马氏链模型:系统在每个时期所处的状态是随机的,且这个时期到下个时期的状态按照一定的概率进行转移,并且下个时期的状态只取决于这个时期的状态和转移概率,与以前无关,此称为马氏性或无后效性。具有此种性质的随机序列称为马氏链。

马氏链模型在经济学、社会学、生态学、遗传学等许多领域有着广泛地应用。第26页,共41页,2023年,2月20日,星期六设随机序列{X(n),n=0,1,2,···}的离散状态空间E为{1,2,···},下面定义马尔科夫链。定义1设随机序列{X(n),n=0,1,2,···}的离散状态空间为E,若对于任意m个非负整数和任意自然数k,以及任意,满足

=

则称{X(n),n=0,1,2,···}为马尔科夫链。第27页,共41页,2023年,2月20日,星期六第28页,共41页,2023年,2月20日,星期六第一节马氏链模型数学表述马氏链:设随机变量序列,其状态空间,若则随机变量序列称为马氏链转移概率(比例频率)时齐的齐次的第29页,共41页,2023年,2月20日,星期六第二节:钢琴销售的存储策略一家商店根据以往的经验,知道平均每周只能售出1架钢琴,先在经理制定的存储策略为:每周末检查库存量,仅当库存量为零时,才定购三架钢琴以供下周销售;否则,不定购。试估计在这种策略下失去销售机会的可能性有多大,以及每周的平均销售量是多少?第30页,共41页,2023年,2月20日,星期六第三节基因遗传生物的外部表征是由生物体内相应的基因决定,基因分优势基因和劣势基因两种,分别用d和r表示,则有三种基因类型,即

D(dd)H(dr)R(rr)

优种混种劣种第31页,共41页,2023年,2月20日,星期六生物繁殖时,一个后代随机的继承父亲两个基因中的一个,母亲两个基因中的一个,形成自己的基因

所以父母的基因类型就以一定的概率决定了每一后代的基因类型。父母基因后代基因DDRRDHDRHHHRD10½0¼000½1½½0100¼½HR第32页,共41页,2023年,2月20日,星期六

随机交配、近亲繁殖

假设在某一生物群体中雄性与雌性的比例是相等的,且在雄性中D,H,R的比例与在雌性中D,H,R的比例相等。第33页,共41页,2023年,2月20日,星期六随机交配:对每一个雌性(或雄性)个体,都以D,H,R的数量比例为概率,与一个雄性(或雌性)个体交配,后代按照前述规则形成他的基因类型设D(dd):H(dr):R(rr)=a:2b:c

且a+2b+c=1

记p=a+b,q=b+c,则群体中优势基因d与劣势基因r的数量比例为d:r=p:q

且p+q=1

第34页,共41页,2023年,2月20日,星期六转移矩阵第35页,共41页,2023年,2月20日,星期六第四节

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论