版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、正态分布及其应用:引言:无论是二项分布还是泊松分布,它们都有一个共同的特点,即当n逐渐增大时,都将趋近于对称分布,进而趋近于正态分布,因此,二项分布和泊松分布的概率表,通常只列出n=20的概率,当n30时,两个分布都趋近于正态分布。正态分布(高斯分布),是一种常用的典型的概率分布。18世纪德国的数学家和天文学家高斯在正态分布理论发展过程中做过突出贡献,因此也被称作“高斯分布”。正态分布的重要地位:1、在实际观察到社会、经济、自然现象的数据表现上,其频率分布与正态分布十分接近;2、正态分布的固有性质,给抽样推断理论提供了必要的基础,使它在抽样分布、区间估计、假设检验中被广泛应用。正态分布的概率密
2、度函数: 式中:x在正负无穷之间;、2为参数;e=2.7183;=3.14159;可记为XN(,2)。1、正态分布曲线特征:(1)曲线为对称分布,在X=处达到极大值;(2)曲线两尾端趋向无穷小,但永不与横轴相交;(3)曲线的形状取决于标准差的大小;(4)曲线的位置取决于平均数的大小;(5)曲线的平均数、中位数、众数相等;(6)曲线下全部面积为1,并在一定标准差倍数范围内,所含的概率比重是相同的。2、数理统计证明:1)、平均数加减一个标准差(1)的范围,包含总体全面积的68.26%;2)、平均数加减一个标准差(2)的范围,包含总体全面积的95.44%;xf(x)CAB3)、平均数加减一个标准差(
3、3)的范围,包含总体全面积的99.74%。正态分布曲线族有两类: 平均数相等标准差不等 平均数不等标准差相等 3、标准正态分布表的使用:怎样将各种形状的正态分布转换为标准正态分布呢?标准正态分布要求: Z值为从随机变量X到该分布平均数的距离,相当于的倍数。Z值可以看成是的标准单位。=60 =20 40 80 原始分布:=60,=20 =60 Z分布:=0 =1 -3 -2 -1 0 1 2 3 例题:已知某总体服从平均数为10,标准差为2.5的正态分布。求任意值大于或等于15的概率。解: Z=(15-10)/2.5=2 0.97725 与Z=2对应的概率为0.97725 P(x15)=1-0.
4、97725 10 15 =0.02275习题1、假如某一学院的入学考试分数是服从平均数为450,标准差为100的正态分布,求:(1)有多少学生比率的得分在400500之间?(2)若某一学生得分是630分,则比他更好和更差的学生其比率各为多少?解:(1) Z1=(400-450)/100= -0.5 Z2=(500-450)/100= 0.5 与Z=0.5对应的概率为0. 400 450 500 则:P(400x500 = 0.-0.5 = 0.2 = 0. (2)Z=(630-450)/100=1.8 则:P(x630= 0.9641P(x630)=1-0.9641= 0.0359习题2、教材
5、P101,11(1) 95.254% 150-Z 200(2) 90% -Z 200 Z习题3、美国某大型商场牙膏销量,据信是服从每周平均数为10000盒,标准差为1500盒的正态分布。问:(1)任意一周牙膏销量超过12000盒的概率是多少?(2)为使公司库存充裕,以满足每周需求高达95%的概率,问库存应备多少盒牙膏?解: (1) Z=(12000-10000)/1500=1.33,与1.33对应的概率=0.4082,超过12000盒的10000 12000 概率=1- 0.=0.(9.176%)。0.95 (2)与0.95概率对应的Z值为1.645, (X-10000)/15000=1.64
6、5,X=12468(盒)。习题4、某一出口产品(容器),技术资料显示,其填装量为服从标准差为0.6盎司的正态分布。若填装重量少于18盎司的比率为2%,问其平均填装重量为多少?解: 与比率1-0.02=0.98,对应的Z=-2.05,绿色健康饮品0.02 (18-)/0.6=-2.05, =19.23(盎司) 18习题5、已知某加工厂工人日包装量为平均每人25件,从中抽取一人,其日包装量小于10件的概率为7.78%,问工人日包装量的标准差是多少?7.78% 解;因为:1-0.0778=0.9222,对应的Z=1.42 所以:与0.0778对应的Z=-1.4210 25 则;(10-25)/=-1
7、.42 -Z =10.56(件)正态分布是推断统计的基石第四章 抽样与抽样分布抽样调查的必要性告诉人们,在许多情况下不必要或不可能进行全面调查,这时,要了解总体的情况,只能由样本统计量估计总体参数。常用的抽样方法 1、简单随机抽样 重复抽样 等概率(纯随机抽样) 不重复抽样 等可能2、分层抽样 先分组,后抽样。 (分类抽样) 4个优点P106(3)3、系统抽样:有序排列 确定起点 间隔抽取 (机械抽样、等距抽样) 随机性4、整群抽样:简便。前提是总体分布均匀。抽样分布与中心极限定理 1、抽样分布:全部可能样本统计量的概率分布叫做抽样分布。(总体分布、样本分布)的抽样形式与特征:以下是一个极端的
8、例子:假定一个实验小组有四人N=4,其写作成绩分别为:21、20、19、18(分)(25为满分)。若样本容量n=2,则全部可能样本(不重复抽样)是6个,6个样本及它们的平均数、准差如下表:样本容量n=2,则全部可能样本(重复抽样)是16个: 频数 频率(%) 18.0 1 0.06 18.5 2 0.1319.0 3 0.19 19.5 4 0.25 20.0 3 0.19 20.5 2 0.1321.0 1 0.06 合计 16 1.00 =? = ? 对比不重复抽样的、有何启示?平均数抽样分布图:接近正态分布。 18 18.5 19 19.5 20 20.5 21 =19.5; =0.79
9、;= = 重复抽样2、中心极限定理:数理统计证明:(1)当总体很大时,无论它呈现何种分布,只要样本容量n足够大,那么样本平均数的抽样分布,必定趋近于正态分布;(2)从正态总体中抽取的全部可能样本,无论样本容量有多大,样本平均数的抽样分布必定遵从于正态分布;即使是非正态总体,只要n30,其抽样分布必定趋近于正态分布;见书P111图4.5(3)抽样分布的平均数等于总体平均数:= ;(4)抽样分布的标准差总体标准差小,且随着样本容量的增加,随之减小:= ;也称为“抽样平均误差”。在区间估计中,样本容量n越大,样本平均数围绕总体平均数摆动的幅度越小,样本平均数的分布曲线变得又窄又高,它意味着样本平均数
10、落在总体平均数附近的概率也相应增大。极限定理在区间估计中的作用:可以确定从总体中抽取一个随机样本,其平均数出现在一个指定值域内的概率。3、平均数的抽样分布及应用:(见PPT)例题:假定某大型公司全部推销员个人营业额(月)的总体分布如下图1,现从中抽取一个包括30人的随机样本,其样本平均数大于15750元的概率是多少?图1:总体分布:=2000 图2:抽样分布 P? 15000 X 15000 解:由于n30,是容量为30的所有可能样本之一,15750是所有样本平均数随机变量之一,见图2。根据中心极限定理作适当变换,下列关系式成立:所以:Z=2.05,查表,对应概率为0.4798,故大于1575
11、0元的概率为0.5-0.4798=0.02。教材P117,16 17教材P118,18(1)20;2;(2)正态;(3)-2.25;(4)1.5教材P118,18(1)1-0.97725=0.02275; (2)1-0.=0.0668;(3)1-0.99379=0.00621; (4)(0.97725 -0.5)+(0.-0.5)=0.;(5)1-0.99865=0.00135。教材P118,19(1)0.8944;(2)0.0228;(3)0.1292;(4)0.9699。教材P118,20(1)(2)1;(3)不一定。教材P118,22趋于正态分布教材P118,23(1)n=4930,正态
12、分布; =213(美元);=4.5918 (2)0.5;大于217的概率是1-0.=0.; 在P(209217)=(0.-0.5)2 = 0.教材P119,(1)=406克;=1.68333;正态分布。(2)1-0.=0.(3)是。因为Z=-3.09,超出了3Z,出现了小概率。教材P18(1)增加;(2)减少。教材P119(1)n=5030,正态。(2)P(830)0;(因为Z=-4.7);(3)生产过程不正常;(4)仍是正态; P(830)=0.0582),(Z=1.57)。教材P119,(3)由(1)可知【】4、有限总体(或不重复抽样)修正系数:问题的提出:用样本估计总体时比较下列误差谁大
13、?无限总体 有限总体 重复抽样 不重复抽样有限总体修正系数为:它永远小于1。当抽样比例n/N0.05时,可以省略修正系数;当抽样比例n/N0.05时,一般需要使用修正系数,原平均误差公式修正为:; 案例:从阿根廷、加拿大、美国到货三批玉米,分别为600包、6000包、60000包。合同规定三批玉米平均每包重量都是80公斤,标准差都是4公斤。要求:(1)若从每批玉米中都抽取300包为样本,分别计算它们的平均误差。有何启示?(要求都使用修正系数)三批玉米的抽样比例n/N分别为:阿300/600=0.5;加300/6000=0.05;美300/60000=0.005习题1:某地有200家外贸企业,年
14、平均出口额为90万美元,标准差为27万美元,随机抽取36家企业调查,问其年平均出口额在100万美元以上的概率为多少?解:习题2:某食品公司收购一批鲜蛋共1500箱,平均每箱为25.75斤,标准差5.25公斤。问由100箱组成的一个随机样本所计算的平均重量在2527公斤之间的概率有多大?超过26公斤的概率有多大?解:5、比例的抽样分布:当总体中各元素只能以“成功”和“失败”表示时,用P表示“成功”的比例,(1-P)表示“失败”的比例。中心极限定理证明:P不接近0或1,且n很大时,其抽样分布趋近于正态分布。比例抽样分布的平均误差为:无限总体(或重复抽样):。有限总体(或不重复抽样):。其他问题与平
15、均数相同。 例题:据资料记录,二年级的学生中有43%人,阅读某类文章后表示有困难,现随机抽取100人阅读同类文章,问:感到有困难的学生占五成以下的概率是多少?习题1、一家工厂在正常情况下产品次品率为8%,若产品批量比较大,随机抽取100个产品进行检验,求次品率在7%9%之间的概率。解:(修正系数可以省略)6、t分布:(小样本理论)t分布也称“学生分布” 。19081909年,英国统计学家戈塞特(Gosset),以笔名(Student)陆续在生物计量学杂志上发表了三篇文章:“平均数的概差”、“相关系数的概差”、“论非随机样本平均数的分布”,从而奠定了“小样本理论”的基础,并使他获得了崇高的荣誉。因此, t分布也称“学生分布”。 t分布也是对称分布,形状比正态分布更平缓些,当n30时t分布与正态分布很接近。t分布特征:(1)t分布平均数所处的曲线峰顶低于正态分布;(2)t分布两个尾端的面积按一定比例比正态分布多起来;(3)如果包含曲线下相同的面积,t分布的界限必须离开平均数更远些。自由度:指可以自由选择的数值的个数。不同容量的样本对应与不同的t分布,统计上说“不同的自由度对应着不同的样本”。如:(a+b+c)/3=4,则3*4=12,必须是a+b+c=12,其中:a、
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年重型机械焊接安装服务协议3篇
- 2025年度二手房交易首付分期及风险控制协议4篇
- 2025年度防火门检测维修服务合同4篇
- 2025版协议离婚实操教程与全程辅导合同3篇
- 2025年个人房产测绘与房地产市场调研合同4篇
- 2025版临时演出场地租赁协议书3篇
- 2025年度绿色环保项目临时工劳动合同范本8篇
- 个人家政服务合同2024年度专用3篇
- 2025年度智慧城市基础设施场外工程承包合同4篇
- 2025年度物业设施设备智能化升级合同3篇
- 2024-2025学年山东省聊城市高一上学期期末数学教学质量检测试题(附解析)
- 西方史学史课件3教学
- 2024年中国医药研发蓝皮书
- 广东省佛山市 2023-2024学年五年级(上)期末数学试卷
- 台儿庄介绍课件
- 疥疮病人的护理
- 人工智能算法与实践-第16章 LSTM神经网络
- 17个岗位安全操作规程手册
- 2025年山东省济南市第一中学高三下学期期末统一考试物理试题含解析
- 中学安全办2024-2025学年工作计划
- 网络安全保障服务方案(网络安全运维、重保服务)
评论
0/150
提交评论