数学实验——第五章 概率论与数理统计_第1页
数学实验——第五章 概率论与数理统计_第2页
数学实验——第五章 概率论与数理统计_第3页
数学实验——第五章 概率论与数理统计_第4页
数学实验——第五章 概率论与数理统计_第5页
已阅读5页,还剩187页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第五章第五章 概率论与数理统计实验概率论与数理统计实验 本章介绍本章介绍MatLab中常用分布的有关函数中常用分布的有关函数, 大数定理大数定理与中心极限定理中的问题与中心极限定理中的问题, 数据的描述与直方图数据的描述与直方图, 参数参数估计中的计算估计中的计算, 假设检验中的计算假设检验中的计算, 回归中的计算及随回归中的计算及随机模拟等机模拟等. 问题的提出问题的提出 经济的发展会影响居民的生活经济的发展会影响居民的生活. 在某个地区中学生收在某个地区中学生收收集了收集了 个个 岁学生的身高数据岁学生的身高数据:50170.1 179.0 171.5 173.1 174.1 177.2

2、170.3 176.2163.7 175.4 163.3 179.0 176.5 178.4 165.1 179.4176.3 179.0 173.9 173.7 173.2 172.3 169.3 172.8176.4 163.7 177.0 165.9 166.6 167.4 174.0 174.3184.5 171.9 181.4 164.6 176.4 172.4 180.3 160.5166.2 173.5 171.7167.9 168.7 175.6 179.6 171.617168.1 172.2. 查到查到 年前该学校同龄学生的平均身高为为年前该学校同龄学生的平均身高为为201

3、68cm,近期还调查了附近近期还调查了附近 农村同龄男生的身高农村同龄男生的身高, 计算处均计算处均100值和方差分别为值和方差分别为 和和168.95.4cm, 如何判定当前男生的身高是否发生明显变化如何判定当前男生的身高是否发生明显变化?一、一、MatLab中常用分布的有关函数中常用分布的有关函数常见分布常见分布 二项分布二项分布 泊松分布泊松分布 均匀分布均匀分布 指数分布指数分布命令字符命令字符binoPoissunifexp常见分布常见分布 正态分布正态分布 分布分布 分布分布 分布分布命令字符命令字符normchi2tF2tF几种常见分布及其相应函数表达几种常见分布及其相应函数表达

4、函数函数概率密度函数概率密度函数 分布函数分布函数分位数分位数均值与方差均值与方差随机生成数随机生成数字符字符pdfcdfinvstatrnd每种分布提供的五类函数及其相应函数表达每种分布提供的五类函数及其相应函数表达 1.概率密度函数(分布律)及调用格式概率密度函数(分布律)及调用格式 MatLab自带了一些常见分布的概率密度函数(分布自带了一些常见分布的概率密度函数(分布律)律). 函数名称及调用格式见下表函数名称及调用格式见下表:函数名称及调用格式函数名称及调用格式常见分布常见分布二项分布二项分布泊松分布泊松分布均匀分布均匀分布指数分布指数分布正态分布正态分布 分布分布分布分布分布分布b

5、inopdf x,n,p2tFpoisspdf x,lambdaunipdf x,a,bexppdf x,thetanormpdf x,mu,signachi2pdf x,ntpdf x,nfpdf x,n,m例例 设设200,0.025 ,XB画出该分布的图形画出该分布的图形.输入语句输入语句图形为图形为 的分布律图形的分布律图形200,0.025B 我们知道我们知道, 当当 较大而较大而 适中时适中时, 二项分布可用二项分布可用nnp泊松分布来近似计算泊松分布来近似计算, 即有公式即有公式e.!kP Xkk我们对上例进行对比我们对上例进行对比.例例 设设 ,XE当当 时时, 画出指数函数画

6、出指数函数1,1,22的密度函数图形的密度函数图形.程序如下程序如下: 相应的图形为相应的图形为例例 设设 220,0.5,0,1 ,0,2XNXNXN画出相应的的密度函数图形画出相应的的密度函数图形.程序如下程序如下: 相应的图形为相应的图形为 2.分布函数的调用格式分布函数的调用格式 我们知道我们知道, 若随机变量若随机变量 的分布函数为的分布函数为 即即X ,F x .P aXbF bF a ,F xP Xx则则由此由此, 当分布函数已知时当分布函数已知时, 可以求出所需的概率可以求出所需的概率.例例 设设0,1 ,XN求求22.5 .PX 标准正态分布的分布函数的调用函数为标准正态分布

7、的分布函数的调用函数为normcdf. 输入语句输入语句 返回值返回值注注 一般调用格式一般调用格式normcdf x,mu,sigma .例例 设设 求求1,4 ,XN04 .PX 因随机变量并不服从标准正态分布因随机变量并不服从标准正态分布, 由转换公式由转换公式P aXb.ba 此时此时 由计算公式由计算公式, 得得1,2,3104,22PX 再输入命令再输入命令返回值返回值 例例 设打一次电话所用的时间(单位设打一次电话所用的时间(单位min)服从参数为)服从参数为解解 令令 表示电话间那人打电话所占用的时间表示电话间那人打电话所占用的时间, 则由题则由题X 0.20.2e 0, 0

8、0.xxf xx0.2的指数分布的指数分布, 如果有人刚好在你前面走进公用电话如果有人刚好在你前面走进公用电话间(假定电话间只有一部电话可供使用)间(假定电话间只有一部电话可供使用), 试求你将等试求你将等待超过待超过5分钟的概率分钟的概率; 5分钟到分钟到10分钟之间的概率分钟之间的概率.0.2XE意知意知: 因此相应的密度函数为因此相应的密度函数为因而因而0.25p50.2ed ,xP Xxp510 ,PX 输入命令输入命令 返回值返回值 输入命令输入命令 返回值返回值 指数分布函数的一般调用格式指数分布函数的一般调用格式1mu1ped .muxmuxpexpcdf(x,mu)即即 输入语

9、句输入语句结果为结果为即即:1e d0.6321.xx例例 某人向空中抛一枚质地均匀的硬币某人向空中抛一枚质地均匀的硬币 次次, 求这求这100100次中正面向上的次数恰好为次中正面向上的次数恰好为 与小于与小于 次的概率次的概率.4040解解 记记 为为 次中正面向上的次数次中正面向上的次数, 则则X100100,0.5 .XB所求概率为所求概率为:p40 .P X输入语句输入语句概率为概率为再执行命令再执行命令p40 .P X概率为概率为若还要计算介于若还要计算介于 到到 之间的概率之间的概率, 即计算即计算4020p2040 ,PX再执行命令再执行命令概率为概率为 以上数据你是否发现问题

10、以上数据你是否发现问题? 如何解释该问题如何解释该问题?例例 设设0,1 ,XN求求 33 ;PX 作出其分布函数的图形作出其分布函数的图形.解解 输入命令输入命令概率为概率为该概率即为正态分布中的该概率即为正态分布中的 准则准则!3输入命令输入命令图形为图形为从这个图形中你能感觉到什么从这个图形中你能感觉到什么? 3.分位数的调用分位数的调用 在统计学中在统计学中, 分位数是个极其重要的概念分位数是个极其重要的概念.分位数定义分位数定义:设设 是随机变量是随机变量,X01,满足满足 1P Xp 的的 称为该随机变量的称为该随机变量的上上 分位数分位数; 满足满足p1P Xp 的的 称为该随机

11、变量的称为该随机变量的下下 分位数分位数; 满足满足p1P Xp 的的 称为该随机变量的称为该随机变量的双侧双侧 分位数分位数.p分布名称分布名称上上 分位数调用格式分位数调用格式上上 分位数分位数正态分布正态分布 分布分布 分布分布 分布分布2tFnorminv(1 alpha)zchi2inv(1 alpha,n) 2n tn,Fn mtinv(1 alpha,n)finv(1 alpha,n,m)几种常见分布的上几种常见分布的上 分位数调用格式分位数调用格式例例 0,1 ,N就就 0.025,0.05,0.10求对应的上求对应的上 分位数分位数; 求求 并给出该点的具体位置并给出该点的具

12、体位置. 20.16 ,程序为程序为结果为结果为 输入语句输入语句结果为结果为程序如下程序如下此时此时 20.1610.6446,图形为图形为分位数点分位数点 4.随机数生成函数的调用格式随机数生成函数的调用格式 泊松分布随机数泊松分布随机数 格式格式poissrnd lambda,m n 其中其中 为分布中的未知参数为分布中的未知参数, 即即lambdae,!kP xkk 为矩阵的阶数为矩阵的阶数.,m n例例 产生一个产生一个 的矩阵的矩阵, 其列向量是参数为其列向量是参数为10000 34的泊松随机数的泊松随机数.输入命令输入命令返回值返回值 正态分布随机数正态分布随机数 格式格式nor

13、mrnd mu,sigma,m n例例 生成一个生成一个 的矩阵的矩阵, 其列向量服从其列向量服从10000 30,1 .N输入命令输入命令结果为结果为例例 生成一个生成一个 的矩阵的矩阵, 其列向量服从其列向量服从10000 32,1 .N输入命令输入命令结果为结果为再计算方差再计算方差返回值返回值 标准正态分布随机数的另一个函数为标准正态分布随机数的另一个函数为randn. 在前例中在前例中, 若输入命令若输入命令 结果为结果为 均匀分布随机数均匀分布随机数 格式格式unifrnd, ,a b m n例例 生成一个生成一个 的矩阵的矩阵, 其列向量服从其列向量服从10000 30,1 .U

14、输入命令输入命令结果为结果为例例 生成一个生成一个 的矩阵的矩阵, 其列向量服从其列向量服从10000 31,4 .U输入命令输入命令结果为结果为 注注 生成服从生成服从 上均匀分布随机数还可用函数上均匀分布随机数还可用函数0,1 rand得到得到.在前例中在前例中, 输入命令输入命令返回值返回值结果大致相同结果大致相同.二、大数定理及中心极限定理中的问题二、大数定理及中心极限定理中的问题 1.大数定律大数定律 设随机试验设随机试验 事件事件 在在 次试验中出现次数为次试验中出现次数为,EAn,An若若lim,Annpn则事件则事件 在一次试验中发生的概率为在一次试验中发生的概率为A .P A

15、p例例 (抛硬币问题试验)(抛硬币问题试验) 假设抛均匀硬币出现正面的假设抛均匀硬币出现正面的概率为概率为 分三种情况验证硬币正面出现的频率与概分三种情况验证硬币正面出现的频率与概0.5,率的关系。率的关系。 三种情况下均进行三种情况下均进行1000组实验组实验, 每组实验每组实验的次数分别为的次数分别为 次次.100,1000,10000程序如下程序如下:叠加后的效果叠加后的效果:结论结论 随着实验次数的增加随着实验次数的增加, 频率将逐渐趋于稳定频率将逐渐趋于稳定. 利用大数定律利用大数定律, 还可以以解决下面的问题还可以以解决下面的问题.例例 求圆周率求圆周率. 问题描述问题描述 在矩形

16、在矩形 中任取一个点中任取一个点, 则该点可能落在圆内则该点可能落在圆内, 0,10,1,.DPx yDS其中其中 为为 的面积的面积.DDDD也有可能落在圆外也有可能落在圆外. 由几何概率知道由几何概率知道: 落在区域落在区域 内的内的概率为概率为为估计概率为估计概率, 今产生随机数今产生随机数:, 1,2,iix yin其中其中: 且随机变量且随机变量 均服从区间均服从区间01,01,iixy,X Y22,1.iiiix yDxy由此得到问题的解法由此得到问题的解法.0,1上的均匀分布上的均匀分布. 则则 下面这段程序给下面这段程序给记录有多少个点在圆内记录有多少个点在圆内.出了问题的求解

17、方法出了问题的求解方法. 计算结果为计算结果为例例 用大数定律估计定积分用大数定律估计定积分120d .xx1201d0.33.3xx 相应程序为相应程序为:积分值积分值 2.中心极限定理及应用中心极限定理及应用 中心极限定理中心极限定理 设设 是一个独立同分布的随机变量序列是一个独立同分布的随机变量序列,12,nXXX且且2,01,2, ,iiE XD Xi则对则对 任意一个任意一个 , x有有 1lim.niinXnPxxn 中心极限定理的几何描述中心极限定理的几何描述 当当 较大时较大时, 近似服从正态分布近似服从正态分布.n1niiX程序如下程序如下 相应的图形为相应的图形为下图是下图

18、是 时泊松分布的图形时泊松分布的图形.100n 例例 产生服从二项分布产生服从二项分布 的的 个随机数个随机数, 这里取这里取,B N pn10,0.2,Np计算计算 个随机数的和个随机数的和nnY以及以及,1nYNnpNnpp并把这个过程重复并把这个过程重复 次次, 用这用这 个个100010001nYNnpNnpp绘制频率直方图绘制频率直方图, 并讨论并讨论 与标准正态分与标准正态分1nYNnpNnpp布的关系布的关系.程序如下程序如下 例例 (高尔顿钉板实验)(高尔顿钉板实验) 高尔顿设计了一个钉板实验高尔顿设计了一个钉板实验,图中每个每个黑点表示钉在板上的一个钉子图中每个每个黑点表示钉

19、在板上的一个钉子, 它们彼此它们彼此的距离相等的距离相等, 上一层的每一个钉子的水平位置恰好位于上一层的每一个钉子的水平位置恰好位于下一层的两个钉子的正中间下一层的两个钉子的正中间. 从入口处放进一个直径略从入口处放进一个直径略小于两个钉子之间的距离的小球小于两个钉子之间的距离的小球. 在在小球向下降落过程中小球向下降落过程中, 碰到钉子后均碰到钉子后均以以 的概率向左或向右滚下的概率向左或向右滚下, 于是于是0.5又碰到下一层钉子又碰到下一层钉子. 如此进行下去如此进行下去, 直直到滚到底板的一个格子里为止到滚到底板的一个格子里为止. 把许把许多同样大小的小球不断从入口处放下多同样大小的小球

20、不断从入口处放下, 只要球的数目相只要球的数目相当大当大, 它们在底板将堆成近似正态分布它们在底板将堆成近似正态分布 的密的密20,N度函数图形度函数图形.Ox-8 -7 -6 -5 -4 -3 -2 -1 1 2 3 4 5 6 7 81, 1,kX(1,2,16)k kk程序如下程序如下 输出图形输出图形 例例 掷骰子实验掷骰子实验. 掷掷 次同一个均匀的骰子次同一个均匀的骰子, 观察每个点数出现的频率观察每个点数出现的频率.n程序如下程序如下结果为结果为三、数据的描述与直方图三、数据的描述与直方图 1.数据描写的常用命令为数据描写的常用命令为 hist. 功能功能 生成已知数据的直方图生

21、成已知数据的直方图. 格式格式 hist,.x k例例 对服从正态分布的数据生成相应的直方图对服从正态分布的数据生成相应的直方图.输入命令输入命令图形为图形为 mean. 功能功能 对已知数据计算相应的均值对已知数据计算相应的均值. 格式格式 mean.x例例 生成一个生成一个 的服从均匀分布的矩阵的服从均匀分布的矩阵, 并求相并求相1000 3应的均值应的均值.输入命令输入命令结果为结果为 std. 功能功能 对已知数据计算相应的标准差对已知数据计算相应的标准差. 格式格式 std.x例例 生成生成 个服从个服从 的随机矩阵的随机矩阵, 并计算并计算10000 60,1N相应的均值和方差相应

22、的均值和方差.程序如下程序如下 例例 生成生成 个服从个服从 的随机矩阵的随机矩阵, 并计算并计算10000 60,1U相应的均值和方差相应的均值和方差.程序如下程序如下 var. 功能功能 对已知数据计算相应的标准差对已知数据计算相应的标准差. 格式格式 var.x例例 生成生成 个服从个服从 的随机矩阵的随机矩阵, 并计算并计算10000 60,1U相应的均值和方差相应的均值和方差.程序如下程序如下 range. 功能功能 计算数据列中的最大数与最小数的差计算数据列中的最大数与最小数的差. 格式格式 range.x例例 生成生成 个服从个服从 的数据的数据, 计算相应的均值计算相应的均值,

23、10001,4N方差和极差方差和极差.程序为程序为结果为结果为 hist 功能功能 由已知数据作出相应的直方图由已知数据作出相应的直方图. 格式格式 hist.x例例 生成生成 个服从个服从 的数据的数据, 作出相应的直方作出相应的直方10001,4N图图.输入语句输入语句图形为图形为四、参数估计中的计算四、参数估计中的计算 1.点估计的意义点估计的意义参数参数, 设设 为总体为总体, 为总体的分布为总体的分布, 其中其中 为未知为未知X,f x12,nXXX为来自总体的样本为来自总体的样本, 12,nx xx为相应的观察值为相应的观察值, 则则12,ng x xx就称为参数就称为参数 的点估

24、计的点估计. 通常的点估计为通常的点估计为: 均值均值 的点估计的点估计:11.niixxn2211.niixxn2*211.1niixxn及及 方差方差 的点估计的点估计:2无偏估计无偏估计渐进无偏估计渐进无偏估计 2.区间估计的意义区间估计的意义参数参数, 设设 为总体为总体, 为总体的分布为总体的分布, 其中其中 为未知为未知X,f x12,nXXX为来自总体的样本为来自总体的样本, 12,nx xx为相应的观察值为相应的观察值, 12, 为统计量为统计量, 使得使得121.P 则称区间为则称区间为 的双侧的双侧 置信区间置信区间, 称为称为置信水平置信水平.1 常用的区间估计常用的区间

25、估计 正态总体中正态总体中 已知时已知时 的区间估计的区间估计:1/21/2,;xuxunn这里这里 是标准正态分布的上是标准正态分布的上 分位数分位数.1u*1/21/21,1;ssxtnxtnnn 正态总体中正态总体中 未知时未知时 的区间估计的区间估计: 2211221/ 2/ 2,nnnn这里这里22111niixn为为 的点估计的点估计.2 正态总体中正态总体中 已知时已知时 的区间估计的区间估计:2 正态总体中正态总体中 未知时未知时 的区间估计的区间估计:22221/ 2/ 2,.11nSnSnn这里这里2211niiSxxn为为 的点估计的点估计.2 正态总体中正态总体中 已知

26、时均值差已知时均值差 的区间估计的区间估计:12222212121/21/2,.xyuxyumnmn 正态总体中正态总体中 未知时均值差未知时均值差 的区间估计的区间估计:121111,wwxykSxykSmnmn这里这里222111.2nnwiiiiSxxyymn 将生成概率密度函数的调用函数中的将生成概率密度函数的调用函数中的 改成改成pdffit即可得到相应的点估计和区间估计即可得到相应的点估计和区间估计. 基本格式基本格式mu,sigma,muci,sigmacitypefit, x 2.区间估计方法区间估计方法例例 设设8,21,9,95,10,23,11,67,13.56,x 7.

27、99,12.22,15.89是取自某正态总体的样本观察值是取自某正态总体的样本观察值, 求其均值求其均值 和方差和方差的点估计和区间估计的点估计和区间估计.输入命令输入命令结果为结果为 五、假设检验五、假设检验 1.假设检验的意义假设检验的意义 问题问题 甲方生产一种产品的尺寸服从均值甲方生产一种产品的尺寸服从均值 、50标准差标准差 的正态分布的正态分布, 按批向乙方供货(每批的数按批向乙方供货(每批的数1量很大)量很大), 双方商定每批抽取双方商定每批抽取 件(样本)测量其尺寸件(样本)测量其尺寸,25根据样本均值决定乙方是否接受这批产品根据样本均值决定乙方是否接受这批产品. 取取 若样本

28、均值与若样本均值与 差的绝对值差的绝对值 不超过不超过,x,即即 x时时, 则拒绝该产品则拒绝该产品. 由随机性由随机性, 存在这样的可能存在这样的可能, 该批产品合格但仍被拒该批产品合格但仍被拒绝绝. 商定水平商定水平 使合格品被错误地拒绝的概率不超过使合格品被错误地拒绝的概率不超过,. 记样本的均值记样本的均值2511,25kkxx则则0,1 ./xNn取取0.05,并使得并使得20.95,/xPn故可取故可取12/20.4,5n即当即当0.4x时(时( ), 则接受该产品则接受该产品, 否则拒绝否则拒绝.49.650.4x 总体均值假设检验的一般作法总体均值假设检验的一般作法 设抽取一容

29、量为设抽取一容量为 的样本的样本, 均值及标准差分别为均值及标准差分别为n, ,x记记 010:;:,HH分别称为分别称为原假设原假设和和被选被选假设假设,检验的结果为检验的结果为: 接受接受 或拒绝或拒绝0H0.H 再设显著性水平为再设显著性水平为,当总体方差当总体方差 已知时已知时, 记记2,/xzn则有则有1/21,P zu 从而得到从而得到1/2.zu 这样的检验又称这样的检验又称 检验检验.z 2.MatLab中的检验方法中的检验方法 格式格式h,sig,ci,zztest,sigma,tiilx mu 说明说明 时表示在显著性水平为时表示在显著性水平为 时接受假设时接受假设,h0而

30、当而当 拒绝假设拒绝假设;h1 表示表示 的均值等于的均值等于till0 x;mu 已知时均值已知时均值 的检验(的检验( 检验法)检验法)2z 表示表示 的均值大于的均值大于till1x;mu 表示表示 的均值小于的均值小于till1 x.mu 是在假设成立时的概率是在假设成立时的概率;sig 是均值的置信水平为是均值的置信水平为 的置信区间的置信区间.ci1 未知时均值未知时均值 的检验(的检验( 检验法)检验法)2t 格式格式h,sig,cittest,sigma,tiilx m 注注 检验的意义与检验的意义与 检验法相同检验法相同, 此时统计量为此时统计量为z./xmtsn例例 生成正

31、态总体生成正态总体 的的 个随机样本个随机样本, 分别在分别在0,1N1002已知和已知和 未知的两种情况下未知的两种情况下, 检验检验 和和255.25(取(取 ).0.05.程序如下程序如下:相应的结果为相应的结果为:接受检验接受检验相应的概率相应的概率置信区间置信区间相应的相应的 值值z注意到注意到0.9751.96.u对于检验对于检验 相应的结果为相应的结果为:2,拒绝检验拒绝检验相应的概率相应的概率置信区间置信区间相应的相应的 值值z 未知时的检验结果与上平行未知时的检验结果与上平行.2 两个正态总体均值差的假设检验两个正态总体均值差的假设检验 两个正态总体两个正态总体 和和 的均值

32、的均值211,N 222,N 1与与 比较的检验比较的检验, 命令格式为命令格式为2h,sig,cittest, ,sigma,alpha,tiilx y例例 分别生成服从分别生成服从25,1 ,5.15,0.8NN各各 个个100随机数随机数, 检验两个总体均值检验两个总体均值12.程序如下程序如下运行结果表明结果的不稳定性运行结果表明结果的不稳定性.在上面的问题中在上面的问题中, 若将样本容量取到若将样本容量取到1000,n 则检验则检验结果比较稳定结果比较稳定. (拒绝的概率较大)(拒绝的概率较大) 正态总体分布的检验正态总体分布的检验 意义意义 检查已知数据是否来自一个正态总体检查已知

33、数据是否来自一个正态总体. 格式格式hmormplot( )x 结果分析结果分析 若数据来自一个正态总体若数据来自一个正态总体, 则图形以直线则图形以直线形式显示形式显示.例例 对问题中的对问题中的 个数据个数据, 作以下判定作以下判定:50该该 个数据是否来自一个正态总体个数据是否来自一个正态总体?50检验学生平均身高是否较检验学生平均身高是否较 有明显提高有明显提高?168cm解解 分别执行分别执行结果结果通过正态性检验通过正态性检验正态性检验结果正态性检验结果 两种情况都说明该数据来自正态总体两种情况都说明该数据来自正态总体. 再输入再输入 结果为结果为拒绝假设拒绝假设相应的置信区间为相

34、应的置信区间为由此得到结论由此得到结论: 20年后年后, 该地区同一年龄的学生的平均该地区同一年龄的学生的平均身高有显著提高身高有显著提高.六、回归分析六、回归分析 回归分析是数据分析中的一个重要方面回归分析是数据分析中的一个重要方面, 它在控制理它在控制理论论, 风险预测等方面都有很重要的应用风险预测等方面都有很重要的应用. 1.问题的提出问题的提出例例 为了研究弹簧悬挂不同重量为了研究弹簧悬挂不同重量 时长度时长度 的关系的关系, 通通xy过实验得到下面过实验得到下面 组数据组数据,6510152025307.258.128.959.9010.9011.80 xy相应的散点图为相应的散点图

35、为: 图形让我们有理由相信这两者之间的关系是个线性关图形让我们有理由相信这两者之间的关系是个线性关系系, 由此产生如下问题由此产生如下问题:线性关系的系数是多少线性关系的系数是多少? 即要知道即要知道yaxb中的常数中的常数, ;a b由此得到的常数的可信度是多少由此得到的常数的可信度是多少? 2.一元回归分析一元回归分析 设有数据设有数据, ,x y关系式关系式 01,Yb xb0,1N称为称为一元线性回归模型一元线性回归模型, ib称为称为回归系数回归系数. 在在MatLab下的回归实现下的回归实现. 命令格式命令格式b,bint,r,rint,statsregress( , ,alpha

36、)Y x 符号说明符号说明:回归系数的点估计回归系数的点估计bbint回归系数的区间估计回归系数的区间估计r,rint残差与残差的置信区间残差与残差的置信区间用于回归分析中的相关数据用于回归分析中的相关数据stats states 1相关系数相关系数2R states 2F值值, 若若 , 则拒绝则拒绝1,2FFn states 3对应的概率对应的概率, 当概率小于当概率小于 时时, 回归模回归模0,HF越大回归方程越显著越大回归方程越显著型成功型成功 在原问题中在原问题中, 再输入再输入可得到如下结果可得到如下结果:点估计点估计区间估计区间估计相关系数相关系数 说明回归方程显著说明回归方程显

37、著21R 说明回归方程显著说明回归方程显著0.954454.91,47.71.FF00.05p 最后画出残差图最后画出残差图, 输入输入图形为图形为 应用应用葡萄酒与心脏病问题分析葡萄酒与心脏病问题分析 适量饮用葡萄酒可以预防心脏病适量饮用葡萄酒可以预防心脏病, 下表是下表是 个发达国个发达国19家一年的葡萄酒消耗量(每人从所喝的葡萄酒所摄取的家一年的葡萄酒消耗量(每人从所喝的葡萄酒所摄取的酒精升数)以及一年中因心脏病死亡的人数(每酒精升数)以及一年中因心脏病死亡的人数(每 万万10人数)人数).国家国家酒精数酒精数死亡人数死亡人数国家国家酒精数酒精数死亡人数死亡人数澳大利亚澳大利亚2.521

38、1荷兰荷兰1.8167奥地利奥地利3.9167新西兰新西兰1.9266比利时比利时2.9131挪威挪威0.8277加拿大加拿大2.4191西班牙西班牙6.586丹麦丹麦2.9220瑞典瑞典0.8207芬兰芬兰0.8297瑞士瑞士5.8115法国法国9.171英国英国1.3285冰岛冰岛0.8211美国美国1.2199爱尔兰爱尔兰0.7300德国德国2.7172意大利意大利7.9107要求要求: 由上表做散点图由上表做散点图;求回归系数的点估计和区间估计求回归系数的点估计和区间估计;画出残差图画出残差图, 并做残差分析并做残差分析;已知某个国家成年人每年平均从葡萄酒中摄取已知某个国家成年人每年平

39、均从葡萄酒中摄取 的的8L酒精酒精, 请预测该国家心脏病的死亡率并作图请预测该国家心脏病的死亡率并作图. 散点图为散点图为 程序运行后的结果为程序运行后的结果为相关系数相关系数 说明回归方程显著说明回归方程显著21R 说明回归方程显著说明回归方程显著0.95441,174.45.FF00.05p残差的置信区间都包含零点残差的置信区间都包含零点, 说明回归模型较为理想说明回归模型较为理想.线性函数曲线图形与散点图线性函数曲线图形与散点图 预测预测:由线性函数由线性函数 266.1631 23.9506 ,yx得得 874.5615.y例例 合金强度与碳含量关系分析合金强度与碳含量关系分析 研究表

40、明研究表明 合金的强度合金的强度 与含碳量与含碳量 存在某种关系存在某种关系.yx现有一批数据现有一批数据, 试研究这两者之间的关系试研究这两者之间的关系.0.100.110.120.130.140.1541.042.545.045.545.047.50.160.170.180.200.220.2449.051.050.055.557.559.5xxyy 首先进行曲线拟合首先进行曲线拟合, 观察数据点的特征观察数据点的特征.输入语句输入语句 进行回归分析进行回归分析, 输入语句输入语句 结果为结果为回归比较理想回归比较理想.残差图为残差图为在残差图中在残差图中, 第四个数据异常第四个数据异常,

41、 剔除该数据后剔除该数据后, 继续检验继续检验此时再剔除第五个数据后有此时再剔除第五个数据后有 相应的数据值为相应的数据值为:残差的置信区间都包含零点残差的置信区间都包含零点, 说明回归模型较为理想说明回归模型较为理想. 3.可线性化的一元非线性回归可线性化的一元非线性回归 某些变量间的关系并非一定是线性关系某些变量间的关系并非一定是线性关系, 所以要考虑所以要考虑将这类关系转化为线性关系将这类关系转化为线性关系. 这类关系中比较典型的是这类关系中比较典型的是指数关系指数关系.采用的方法是通过取对数的方法将其转化采用的方法是通过取对数的方法将其转化为线性关系为线性关系.例例 炼钢过程中需要钢包

42、来盛钢水炼钢过程中需要钢包来盛钢水, 由于受到钢水的侵由于受到钢水的侵作用作用, 钢包的容积会不断扩大钢包的容积会不断扩大, 下表给出使用次数和容下表给出使用次数和容积增大的数据积增大的数据:次数次数23457810容积容积106.42108.20109.58109.50110.00109.93110.49次数次数111415161819容积容积110.59110.60110.90110.76111.00111.20钢包使用次数和增大容积的数据钢包使用次数和增大容积的数据图形中可以看出图形中可以看出, 该曲线具有函数该曲线具有函数/eb xya的特征的特征.两边取对数后有两边取对数后有1lnl

43、n/ln.yab xabx以此数据作为回归数据以此数据作为回归数据, 则有则有 残差图为残差图为 4.多元回归分析多元回归分析 所谓多元回归指的是所谓多元回归指的是: 设设 12,mxx xx若若变量变量 具有关系具有关系y01 1,mmybb xb x20,N上式即称为多元回归模型上式即称为多元回归模型. 多元回归的意义多元回归的意义 设有设有 个独立观察值个独立观察值n12,1,2,iiiimy xxxin由上式得由上式得2011,0,iimimiiybb xb xN记记111111212111111,1mmnnmnmnxxybxxybXYbxxyb 则上式可简写成则上式可简写成2,0,Y

44、XbN再记再记 21,nTiQ bYXbYXb则则 的最小二乘估计为的最小二乘估计为b1.TTbX XX Y221nAiiSyy称其为观察值称其为观察值 12,ny yy的离差平方和的离差平方和; 上式可以上式可以分解成分解成12222,AAASSS其中其中1221,nAiiSyy2221,nAiiSyy分别称为分别称为回归平方和回归平方和及及残差平方和残差平方和. 模型的有效性检验模型的有效性检验:012:0,mHbbb可以证明可以证明, 当当 成立时成立时, 有以下结论有以下结论:0H 1222;ASm 与与 相互独立相互独立;12AS22AS1222/,1 ./1AASmFF m nmS

45、nm 多元回归方法多元回归方法 与一元回归方法相仿与一元回归方法相仿, 在在MatLab中中, 进行回归的命令进行回归的命令是是:b,bint,r,rint,statsregress( ,alpha)Y X其中数值的意义与一元回归数值相仿其中数值的意义与一元回归数值相仿.例例 血压、年龄、体质指数与吸烟关系的数据分析血压、年龄、体质指数与吸烟关系的数据分析 体质指数体质指数2kg.mWH 下表给出下表给出 个人的血压和体质指数个人的血压和体质指数, 试建立相应的试建立相应的30如果还有吸烟的习惯如果还有吸烟的习惯, 怎样在模型中加以考虑怎样在模型中加以考虑.模型模型;序号序号血压血压/mmHg

46、年龄年龄体质指数体质指数吸烟习惯吸烟习惯11443924.2022154731.1131384522.6041454724.0151626525.9161424625.1071706729.5181244219.7091586727.21101545619.30序号序号血压血压/mmHg年龄年龄体质指数体质指数吸烟习惯吸烟习惯111626428.01121505625.80131405927.30141103420.10151284221.70161304822.21171354527.40181141818.80191162022.60201241921.50序号序号血压血压/mmHg年龄年

47、龄体质指数体质指数吸烟习惯吸烟习惯211363625.00221425026.21231203923.50241202120.30251604427.11261585328.61271446328.30281302922.01291252525.30301756927.41 记血压为记血压为 年龄为年龄为 体质指数为体质指数为 吸烟习惯为吸烟习惯为, y1,x2,x3,x则模型为则模型为01 12233.ybb xb xb x 回归分析后的结果为回归分析后的结果为模型还是比较理想模型还是比较理想, 残差图为残差图为说明数据中有说明数据中有2个异点个异点, 剔除后模型更加完善剔除后模型更加完善.

48、结果为结果为 由此得到回归方程由此得到回归方程:12358.51010.43032.344910.3065,yxxx上式说明上式说明, 在相同情况下在相同情况下, 吸烟者比不吸引者血压将升吸烟者比不吸引者血压将升高高 10.3065(mmHg).七、随机模拟七、随机模拟 1.随机模拟的意义随机模拟的意义 随机模拟是一种随机实验的方法随机模拟是一种随机实验的方法, 又称为蒙特卡洛方又称为蒙特卡洛方法法. 该方法起源于美国第二次世界大战期间研制原子弹该方法起源于美国第二次世界大战期间研制原子弹的的“曼哈顿曼哈顿”计划计划. 该项目的主持人之一该项目的主持人之一冯冯诺依曼用驰名世界的赌诺依曼用驰名世

49、界的赌城城摩纳哥的蒙特卡洛来命名这种方法摩纳哥的蒙特卡洛来命名这种方法. 基本思想基本思想 设计某一个随机实验设计某一个随机实验, 使得某个事件的概率与一个未使得某个事件的概率与一个未知数有关知数有关. 对该问题做重复试验对该问题做重复试验, 以频率取代该问题的以频率取代该问题的概率概率. 从而求得该问题的近似解从而求得该问题的近似解. 2. 的模拟计算的模拟计算例例 设计一个计算方法以得到设计一个计算方法以得到 的近似计算值的近似计算值.方法方法 以普丰投针法进行求解以普丰投针法进行求解.dx 在平面上作出两条距离为在平面上作出两条距离为 的平行线的平行线.d取一根长度取一根长度 为为 的针

50、的针, 将针投向该区域将针投向该区域, 以以 表示针的中表示针的中l ldx点与最近一条平行线的距离点与最近一条平行线的距离, 表示针与直线的交角表示针与直线的交角, 则有则有:针与直线相交针与直线相交.sin2xl即即sin .2lx由几何概率知由几何概率知: 针与平行线相交的概率针与平行线相交的概率 2.m AlPmdOsin .2lx22dx 在在MatLab下下, 建立相应的求解程序建立相应的求解程序.程序如下程序如下 的另一种估算方法的另一种估算方法 问题描述问题描述 在矩形在矩形 中任取一个点中任取一个点, 则该点可能落在圆内则该点可能落在圆内, 0,10,1,.DPx yDS其中

51、其中 为为 的面积的面积.DDDD也有可能落在圆外也有可能落在圆外. 由几何概率知道由几何概率知道: 落在区域落在区域 内的内的概率为概率为为估计概率为估计概率, 今产生随机数今产生随机数:, 1,2,iix yin其中其中: 且随机变量且随机变量 均服从区间均服从区间01,01,iixy,X Y22,1.iiiix yDxy由此得到问题的解法由此得到问题的解法.0,1上的均匀分布上的均匀分布. 则则例例 用用Monte Carlo方法估计定积分方法估计定积分120d .xx120d0.33.xx 相应程序为相应程序为:程序如下程序如下: 问题问题 如何计算积分如何计算积分 ?220dxx程序如下程序如下:例例 用用Monte Carlo方法估计定积分方法估计定积分10sind .xxx相应程序如下相应程序如下:在在MatLab下进行数值积下进行数值

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论