姜启源《大学数学实验》第10章_第1页
姜启源《大学数学实验》第10章_第2页
姜启源《大学数学实验》第10章_第3页
姜启源《大学数学实验》第10章_第4页
姜启源《大学数学实验》第10章_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

大学数学(shùxué)实验MathematicalExperiments实验10数据的统计(tǒngjì)与分析1精品资料数据(shùjù)的统计与分析的两类方法第一类:一般意义(yìyì)的统计(普查)对生产的全部1000件产品逐一检验,发现18件次品对全区居民逐一调查,得到月平均支出为828元次品率:1.8%;月平均支出为828元优点:结果完全确定,可信缺点:调查、收集的数据量可能很大,经费投入大;有些产品不允许全部检验,如灯泡、电器的寿命等2精品资料缺点:结果是随机(suíjī)的,是否可信?第二类:数理统计(shùlǐtǒnɡjì)(抽查)全部产品中随机抽取100件,发现2件次品随机调查了200位居民,得到月平均支出为788元次品率:2%;月平均支出788元优点:调查、收集的数据量小,经费投入小,适合不允许全部检验的产品,如灯泡、电器的寿命等任务:怎样用它来估计整体的状况(全部产品的次品率,全体居民的月平均支出)3精品资料本实验基本(jīběn)内容2.数据(shùjù)的整理和描述3.随机变量的概率分布及数字特征1.实例及其分析4.用随机模拟计算数值积分5.实例的建模和求解4精品资料1.实例(shílì)及其分析5精品资料实例(shílì)1:报童的利润报童每天购进报纸零售,晚上将卖不掉的报纸退回;每份报纸购进价a,零售价b,退回价c:b≥a≥c;为获得(huòdé)最大利润,该报童每天应购进多少份报纸?设a=0.8元,b=1元,c=0.75元,为报童提供最佳决策需求量100—120—140—160—180—200—220—240—260—280—天数3913223235201582159天报纸需求量的情况

6精品资料分析(fēnxī):每天报纸需求量随机,报童每天利润也随机;以每天平均利润最大为目标,确定最佳决策。数学模型近似(jìnsì):决策变量:报童每天购进报纸的份数n每天需求为r的天数所占的百分比,记做f(r);如200(-219)份所占的百分比为35/159=22%平均利润:V(n)

实例1:报童的利润(续)7精品资料实例2:路灯(lùdēng)更换策略管理部门:不亮灯泡,折合(zhéhé)计时进行罚款。路政部门:路灯维护条件:需要专用云梯车进行线路检测和更换灯泡;向相应管理部门提出电力使用和道路管制申请;向雇用的各类人员支付报酬等更换策略:

整批更换路政部门的问题:多长时间进行一次灯泡的全部更换?换早了,很多灯泡还没有坏;换晚了,要承受太多的罚款。8精品资料2.数据(shùjù)的整理和描述数据的收集和样本的概念(gàiniàn)数据的整理、频数表和直方图统计量MATLAB命令9精品资料数据(shùjù)的收集银行随机选了50名顾客进行(jìnxíng)调查测量每个顾客感觉舒适时的柜台高度(单位:厘米)1001101369710410095120119991261131151089311610212212112211811711410611011912711912511910595117109140121122131108120115112130116119134124128115110银行怎样依据它确定柜台高度呢?10精品资料样本:统计研究(yánjiū)的主要对象总体--研究对象的全体。如所有顾客感觉(gǎnjué)舒适的高度个体--总体中一个基本单位。如一位顾客的舒适高度样本--若干个体的集合。如50位顾客的舒适高度样本容量--样本中个体数。如50顾客群体的舒适高度~随机变量X,概率分布F(x)n位顾客的舒适高度{xi,i=1,…n}(样本)~相互独立的、分布均为F(x)的一组随机变量。样本:随机取值的一组数据;一组相互独立的、同分布的随机变量。11精品资料数据(shùjù)的整理比较直观,比较清晰的结论21—50岁的中青年患者(huànzhě)大约占总发病人数的3/4,提醒民众中青年是易感人群。年龄10岁以下11-20岁21-30岁31-40岁41-50岁51岁以上总数人数241456773823323371897比例1.27%7.64%35.69%20.14%17.50%17.77%100%北京地区SARS患者的统计数据(截至2003年5月5日)12精品资料频数(pínshù)表将数据的取值范围划分(huàfēn)为若干个区间,统计这组数据在每个区间中出现的次数,称为频数,得到一个频数表。柜台高度频数表中点95.35100.05104.75109.45114.15118.85123.55128.25132.95137.65频数44368125422作用:推测出总体的某些简单性质。如上表表明选择柜台高度在107.10至125.90的有31人,占总人数的62%,柜台高度设计在这个范围内,会得到大多数顾客的满意。13精品资料直方图(histogram):频数(pínshù)分布图柜台高度直方图14精品资料平均值平均值(mean,简称(jiǎnchēng)样本均值)定义为频数(pínshù)表和直方图给出某个范围的状况,无法直接给出具体值,如确定柜台具体高度可作为设计柜台高度的参考值15精品资料例:两个(liǎnɡɡè)班的一次考试成绩序号12345678910111213141516甲班92888592957984878865937388879480乙班84838285828182908478758378858479序号17181920212223242526272829303132甲班69868878796888875593798590539981乙班857390778182828086837778现象1:甲班平均值:82.75分,乙班平均值:81.75分结论:大致表明甲班的平均成绩稍高于乙班现象2:甲班90分以上7人,但有2人不及格,分数分散乙班全在73分到90分之间,分数相对(xiāngduì)集中16精品资料考试成绩直方图甲乙17精品资料描述(miáoshù)数据的分散程度(统计上称为变异)样本(yàngběn)x=(x1,x2,,xn)的标准差(Standarddeviation)为:

甲班的标准差为10.98分,乙班的标准差为3.98分,表明甲班成绩的分散程度远大于乙班。统计量:由样本加工出来的、集中反映样本数量特征的函数。三类统计量:位置,变异程度,分布形状标准差18精品资料偏度(skewness):分布(fēnbù)对称性峰度(kurtosis):分布(fēnbù)形状表示位置的还有:中位数(median):将数据由小到大排序后处于中间位置的那个数值。n为奇数时,中位数唯一确定;n为偶数时,定义为中间两数的平均值表示变异程度的还有:极差(range):x1,x2,,xn的最大值与最小值之差。方差(variance):标准差的平方s2。表示分布形状的:统计量19精品资料MATLAB数据(shùjù)描述的常用命令命令名称输入输出注意事项[n,y]=hist(x,k)频数表x:原始数据行向量k:等分区间数n:频数行向量y:区间中点行向量[n,y]=hist(x)中k取缺省值10hist(x,k)直方图同上直方图同上mean(x)均值x:原始数据行向量median(x)中位数同上中位数range(x)极差同上极差std(x)标准差同上标准差sstd(x,1):s1var(x)方差同上方差s2var(x,1):s12skewness(x)偏度同上偏度g1kurtosis(x)峰度同上峰度g220精品资料求银行柜台高度(gāodù)的频数表、直方图及均值等统计量:示例(shìlì)输出图和下列结果:N=44368125422Y=95.3500100.0500104.7500109.4500114.1500118.8500123.5500128.2500132.9500137.6500x1=115.2600,x2=116.5000x3=47,x4=10.9690x5=-0.0971,x6=2.621621精品资料3.随机变量(suíjībiànliànɡ)的概率分布及数字特征频率与概率概率密度与分布函数期望和方差常用(chánɡyònɡ)的概率分布MATLAB命令22精品资料频率(pínlǜ)与概率保证抽取样本的随机性和独立性:样本容量无限增大(zēnɡdà)时,频率会趋向一个确定值;这个值称为随机变量X落入区间(a,b]的概率(Probability),记作频率:样本数据在一个确定区间(a,b]的频数k与样本容量n的比值23精品资料概率密度与分布(fēnbù)函数概率密度函数(Probabilitydensityfunction,简称(jiǎnchēng)概率密度):概率分布函数(Cumulativedistributionfunction,简称分布函数)对于连续随机变量24精品资料p(x)示例(shìlì)25精品资料期望(qīwàng)和方差随机变量X的期望(qīwàng)就是平均值的意思,记作EX或方差总体均值(方差)与样本均值(方差)的关系:26精品资料常用(chánɡyònɡ)的概率分布均匀分布(Uniformdistribution):X~U(a,b)指数分布(Exponentialdistribution):X~Exp()

27精品资料相应(xiāngyīng)的密度函数28精品资料正态分布(Normdistribution):常用(chánɡyònɡ)的概率分布标准(biāozhǔn)正态分布29精品资料分布(fēnbù)(Chisquare):,n称自由度定义(dìngyì):服从标准正态分布的随机变量其中相互独立、常用的概率分布

30精品资料n为自由度t分布(fēnbù)(Student分布(fēnbù))其中,X,Y相互独立定义:常用(chánɡyònɡ)的概率分布31精品资料F分布(fēnbù):称自由度相互独立定义:常用(chánɡyònɡ)的概率分布32精品资料记n次独立试验中成功的次数(cìshù)是随机变量X二项分布(Binomialdistribution)X~B(n,p)背景(bèijǐng)问题:产品检验中的废品个数常用的概率分布:离散分布

贝努利试验:一次试验只有两种结果(成功和失败)记成功的概率为p,q=1-p33精品资料

当二项分布的n,np(常数(chángshù))时泊松分布(fēnbù)(Poissondistribution)X~Poiss(),背景问题:服务系统在一定时间内接到的呼唤数(到达率)常用的概率分布:离散分布

34精品资料MATLAB命令(mìnglìng)分布均匀分布指数分布正态分布分布t分布F分布二项分布泊松分布字符unifexpnormchi2tfbinopoiss功能概率密度分布函数逆概率分布均值与方差随机数生成字符pdfcdfinvstatrndy=normpdf(1.5,1,2)正态分布(=1,=2)在x=1.5处的概率密度(标准(biāozhǔn)正态分布的,可省略)y=normcdf([-101.5],0,2)在x=-1,0,1.5处分布函数值[m,v]=fstat(3,5)计算F(3,5)的期望和方差x=tinv(0.3,10)计算t(10)的0.3-分位数35精品资料二维正态分布二维随机变量(suíjībiànliànɡ)二维随机变量(suíjībiànliànɡ)联合分布密度函数边际分布密度函数协方差相关系数36精品资料二维随机变量(suíjībiànliànɡ):MATLAB命令cov(x,y)计算(jìsuàn)协方差(矩阵)

corrcoef(x,y)

计算相关系数(矩阵)二维随机数生成/二维密度函数(例)mu=[1-1],Sigma=[.9.4;.4.3],X=mvnrnd(mu,Sigma,10),p=mvnpdf(X,mu,Sigma)二维数据处理37精品资料4.用随机(suíjī)模拟计算数值积分4.1定积分(jīfēn)的计算4.2重积分(jīfēn)的计算4.3MATLAB实现38精品资料方法的直观(zhíguān)解释——随机投石y101x·向单位(dānwèi)正方形里随机投n块小石头*******若有k块小石头落在1/4单位圆内,当n很大时1/4单位圆的面积(计算的一种方法)1)随机投点法目的:计算1/4单位圆的面积39精品资料大数(dàshù)定律(贝努利定理)随机变量(suíjībiànliànɡ)(X,Y)在单位正方形内均匀分布点(xi,yi)落在1/4单位圆内概率y101x·一般地投点坐标(xi,yi),xi,yi是相互独立、(0,1)内均匀分布的随机变量((0,1)随机数)设k是n次独立重复试验中事件A发生的次数。p是事件A在每次试验中发生的概率,则对任意的正数,有40精品资料产生n组(0,1)随机数(xi,yi),其中k组满足随机投点法y101x·随机(suíjī)投点法(续)41精品资料大数定律(dìnglǜ)(辛钦定理)设随机变量相互独立(dúlì),服从同一个分布,且具有数学期望则对任意的正数有随机变量X的概率密度为的期望为2)均值估计法产生(a,b)区间上的随机数xi(i=1,2,…n),n很大42精品资料用随机模拟(mónǐ)方法计算任意区间上的积分其中(qízhōng)ui为(0,1)随机数均值估计法不要产生yi,不用比较限制;没有均值估计法的优点均值估计法(续)43精品资料随机模拟法计算(jìsuàn)重积分xy

1

0

1g2(x)g1(x)产生相互(xiānghù)独立(0,1)随机数xi,yi,,i=1,…n;落在内m个点记作(xk,yk),k=1,…m可用于任意的f,,且可推广至高维结果的精度和收敛速度与维数无关计算量大,精度低,结果具有随机性44精品资料一般区间重积分(jīfēn)的计算

分别为[a,b]和[c,d]区间上的均匀分布随机数,判断每个点是否落在Ω域内,将落在Ω域内的m个点记作则

45精品资料MATLAB实现(shíxiàn)随机数的产生(chǎnshēng):unifrnd(a,b,m,n)产生m行n列[a,b]区间上的均匀分布随机数。当a=0,b=1时,可用rand(m,n)随机投点法计算

n=10000;x=rand(2,n);k=0;fori=1:nifx(1,i)^2+x(2,i)^2<=1k=k+1;endendp=4*k/n46精品资料xy0积分(jīfēn)域和被积函数的对称性蒙特卡罗方法(fāngfǎ):x取(0,a)随机数,y取(0,b)随机数例:炮弹命中概率1是椭圆在第1象限的部分47精品资料5.实例(shílì)的建模和求解报童的利润路灯(lùdēng)更换策略48精品资料报童(bàotóng)的利润1)每份报纸(bàozhǐ)的购进价a,零售价b,退回价为c假设:2)需求为连续随机变量x,大致服从正态分布3)将历史的统计表看作需求量的频率,由此

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论