第3章抽样与抽样分布介绍.doc_第1页
第3章抽样与抽样分布介绍.doc_第2页
第3章抽样与抽样分布介绍.doc_第3页
第3章抽样与抽样分布介绍.doc_第4页
第3章抽样与抽样分布介绍.doc_第5页
免费预览已结束,剩余20页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1正态分布及其应用:引言:无论是二项分布还是泊松分布,它们都有一个共同的特点,即当n 逐渐增大时,都将趋近于对称分布,进而趋近于正态分布,因此,二项分布和泊松分布的概率表,通常只列出 n=20 的概率,当 n30 时,两个分布都趋近于正态分布。正态分布(高斯分布),是一种常用的典型的概率分布。18 世纪德国的数学家和天文学家高斯在正态分布理论发展过程中做过突出贡献,因此也被称作“高斯分布” 。正态分布的重要地位:1、在实际观察到社会、经济、自然现象的数据表现上,其频率分布与正态分布十分接近;2、正态分布的固有性质,给抽样推断理论提供了必要的基础,使它在抽样分布、区间估计、假设检验中被广泛应用。

2、正态分布的概率密度函数:(x)1e ( x )2 / 2 222式中: x 在正负无穷之间;、 2 为参数; e=2.7183 ; =3.14159 ;可记为 XN(, 2)。 1、正态分布曲线特征:12( 1)曲线为对称分布,在 X=处达到极大值;( 2)曲线两尾端趋向无穷小,但永不与横轴相交;( 3)曲线的形状取决于标准差的大小;( 4)曲线的位置取决于平均数的大小;( 5)曲线的平均数、中位数、众数相等;( 6)曲线下全部面积为 1,并在一定标准差倍数范围内,所含的概率比重是相同的。 2、数理统计证明:1) 、平均数加减一个标准差( 1)的范围,包含总体全面积的 68.26%;2)、平均

3、数加减一个标准差(2)的范围,包含总体全面积的 95.44%;f(x)3)、平均数加减一个标准差(3)的范围,包含总体B全面积的 99.74%。C布曲线族有两类:正态分A平均数相等标准差不等x平均数不等标准差相等 3、标准正态分布表的使用:怎样将各种形状的正态分布转换为标准正态分布呢?0;1; zx -。标准正态分布要求:Z 值为从随机变量X 到该分布平均数的距离, 相当于23的倍数。 Z 值可以看成是的标准单位。=60=204080原始分布: =60, =20 =60Z分布: =0=1-3-2-1 0 1 2 3习题 : 教材 P117,1617习题 1、假如某一学院的入学考试分数是服从平均

4、数为450,标准差为 100 的正态分布,求:( 1)有多少学生比率的得分在 400500 之间?( 2)若某一学生得分是 630 分,则比他更好和更差的学生其比率各为多少?解:(1)Z1=( 400-450)/100=-0.5Z2=( 500-450)/100=0.5与 Z=0.5 对应的概率为 0.691462400 450500则: P(400x500 = 0.691462-0.5= 0.1914622 = 0.382924( 2)Z=(630-450 )/100=1.834则: P( x630= 0.9641P(x630)=1-0.9641= 0.0359习题 2、教材 P101,11

5、(1)95.254%p( x 150) p( z150 200)30p( z1.6667) 0.95254150-Z200(2)90%p( x 200k)p( zx 200k )0.93030即: p( zk0.95,k49.35)1.645, k3030-Z200Z习题 3、美国某大型商场牙膏销量, 据信是服从每周平均数为 10000 盒,标准差为1500 盒的正态分布。问:(1)任意一周牙膏销量超过12000 盒的概率是多少?( 2)为使公司库存充裕, 以满足每周需求高达 95%的概率,问库存应备多少盒牙膏?解:(1) Z= (12000-10000 ) /1500=1.33 ,与 1.3

6、3 对应的概率 =0.4082 ,超过 12000 盒的10000 12000概率 =1- 0.908241=0.091759 ( 9.176%)。0.95( 2)与 0.95 概率对应的 Z 值为 1.645 ,( X-10000)/15000=1.645 ,X=12468(盒)。45习题 4、某一出口产品(容器) ,技术资料显示,其填装量为服从标准差为0.6 盎司的正态分布。若填装重量少于18 盎司的比率为 2%,问其平均填装重量为多少?解:与比率 1-0.02=0.98,对应的 Z=-2.05 ,0.02( 18- ) /0.6=-2.05, =19.23 (盎司)绿色18健康饮品习题

7、5、已知某加工厂工人日包装量为平均每人25 件,从中抽取一人,其日包装量小于10 件的概率为7.78%,问工人日包装量的标准差是多少?7.78%解;因为: 1-0.0778=0.9222 ,对应的 Z=1.42所以:与 0.0778 对应的 Z=-1.4210 25则;( 10-25 ) / =-1.42-Z=10.56 (件)正态分布是推断统计的基石第四章抽样与 抽样分布抽样调查的必要性告诉人们,在许多情况下不必要或不可能 进行全面调查, 这时,要了解总体的情况,只能由样本统计量估计总体参数。常用的抽样方法561、简单随机抽样重复抽样等概率(纯随机抽样)不重复抽样等可能2、分层抽样先分组,后

8、抽样。(分类抽样)4 个优点 P106(3)3、系统抽样: 有序排列确定起点间隔抽取(机械抽样、等距抽样)随机性4、整群抽样:简便。前提是总体分布均匀。抽样分布与中心极限定理 1、抽样分布: 全部可能样本 统计量 的概率分布叫做抽样分布。(总体分布、样本分布) x 的抽样形式与特征:以下是一个极端的例子:67假定一个实验小组有四人N=4,其写作成绩分别为:21、20、n1(21,20)x120.5s10.7071n2(21,19)x220s21.4142n3(21,18)x319.5s32.1213n4(20,19)x419.5s40.7071n5(20,18)x519n6(19,18)x61

9、8.5x(x21 20 19 18 19.5)x19.5nn4x 0.645(1.118)19、18(分)(25 为满分)。若样本容量n=2,则全部可能样本( 不重复抽样 )是 6 个, 6 个样本及它们的平均数、准差如下表:样本容量 n=2,则全部可能样本( 重复抽样 )是 16 个:x频数频率( %)18.010.0618.520.1319.030.1919.540.2520.030.1920.520.1321.010.0678合计161.00x =? x = ? 对比不重复抽样的 x 、 x 有何启示?平均数抽样分布图:接近正态分布。18 18.5 1919.5 20 20.5 21xx

10、 =19.5 ;x =0.79 ; x =1.1180.79 =n2重复抽样 2、中心极限定理:数理统计证明:( 1)当总体很大时,无论它呈现何种分布,只要样本容量 n 足够大,那么样本平均数的抽样分布,必定趋近于正态分布;( 2)从正态总体 中抽取的全部可能样本,无论样本容量有多大, 样本平均数的抽样分布必定遵从于正态分布; 即使是非正态总体,只要 n 30,其抽样分布必定趋近于正态分布;见书 P102 图 3.2589( 3)抽样分布的平均数等于总体平均数:x =;( 4)抽样分布的标准差比总体标准差小,且随着样本容量的增加,x 随之减小:x =;n见书 P109 图 3.28 见书 P1

11、02 图 3.25 x 也称为 “抽样平均误差” 。在区间估计中,样本容量 n 越大,样本平均数围绕总体平均数摆动的幅度越小, 样本平均数的分布曲线变得又窄又高,它意味着样本平均数落在总体平均数附近的概率也相应增大。 极限定理在区间估计中的作用 :可以确定从总体中抽取一个随机样本,其平均数出现在一个指定值域内的概率。 3、平均数的抽样分布及应用:( 见 PPT)例题:假定某大型公司全部推销员个人营业额(月)的总体分布如下图 1,现从中抽取一个包括30 人的随机样本,其样本平均数大于15750 元的概率是多少?图 1:总体分布: =2000图 2:抽样分布P?15000X15000X910解:由

12、于 n30,是容量为 30 的所有可能样本之一, 15750是所有样本平均数随机变量之一,见图 2。根据中心极限定理作适当变换,下列关系式成立:x15000zx - x 修改后:xxxx 该公式引入了样本概念 。zxn所以: Z=2.05,查表,对应概率为 0.4798 ,故大于 15750元的概率为 0.5-0.4798=0.02。 教材 P118,18(1)20;2;(2)正态;(3)-2.25 ;(4)1.5 教材 P118,18( 1)1-0.97725=0.02275 ; ( 2)1-0.933193=0.0668 ;( 3)1-0.99379=0.00621 ;( 4)(0.977

13、25 -0.5 )+(0.841345-0.5 )=0.818595;( 5)1-0.99865=0.00135 。 教材 P118,19( 1)0.8944 ;(2)0.0228 ;(3)0.1292 ;(4)0.9699 。教材 P118,201011x1003;x 1003 0.333333 ;x100 1 ;(101,99)(1) z10900(2)1 ;(3)不一定。 教材 P118,22趋于正态分布教材 P118,23(1)n=4930,正态分布;22x =213(美元);x=( 2)0.5 ;2x15494.5918大于 217 的概率是 1-0.969258=0.030742

14、;在 P( 209217) =(0.969258-0.5 ) 2= 0.938516教材 P119,(1)x =406 克;x =1.68333 ;正态分布。( 2)1-0.998999=0.001001( 3)是。因为 Z=-3.09 ,超出了 3Z,出现了小概率。 教材 P18(1)增加;(2)减少。教材 P119( 1)n=5030,正态。1112( 2)P( X 830) 0;(因为 Z=-4.7 );( 3)生产过程不正常;( 4)仍是正态; P ( X 830)=0.0582 ),(Z=1.57 )。教材 P119,(1) :31%0.015x4(2) : p(3 xx 3 x )

15、 (1 0.99865) 2 0.0027(3)由( 1)可知【】4、有限总体 ( 或不重复抽样 ) 修正系数:问题的提出:用样本估计总体时比较下列误差谁大?无限总体有限总体重复抽样不重复抽样有限总体修正系数为:Nn它永远小于 1。N1当抽样比例n/N 0.05 时,可以省略修正系数;当抽样比例n/N0.05 时,一般需要使用修正系数,原平均误差公式修正为:xNnnN1 ;案例:从阿根廷、加拿大、美国到货三批玉米,分别为600 包、6000 包、60000 包。合同规定三批玉米平均每包重1213量都是 80 公斤,标准差都是 4 公斤。要求:(1)若从每批玉米中都抽取 300 包为样本,分别计

16、算它们的平均误差。有何启示?(要求都使用修正系数)(1)460030040.163xA60010.7130017.324600030040.225xJ300600010.9717.3246000030040.23xM3006000010.9917.32三批玉米的抽样比例n/N 分别为:阿 300/600=0.5;加 300/6000=0.05;美 300/60000=0.005习题 1:某地有 200 家外贸企业,年平均出口额为 90 万美元,标准差为 27 万美元,随机抽取 36 家企业调查,问其年平均出口额在100 万美元以上的概率为多少?n30, n / N36 / 2000.18解:x

17、nNn2720036270.9078 4.085N13620016Zx x100902.45; p(x100)10.992857 0.0071434.085x习题 2:某食品公司收购一批鲜蛋共1500 箱,平均每箱为 25.75 斤,标准差 5.25 公斤。问由 100 箱组成的一个随机样本所计算的平均重量在 2527 公斤之间的概率有多1314大?超过 26 公斤的概率有多大?N1500, x25.75,5.25, n 10030, n / N0.6675.2515001000.5250.96640.50736x10015001Z12525.751.48, Z22725.752.460.50

18、7360.50736解:0.430563P(25 x27)0.4930530.923616z32625.750.49; p( x26)10.6879330.3120670.50736 5、比例的抽样分布:当总体中各元素只能以“成功”和“失败”表示时,用 P 表示“成功”的比例,( 1-P)表示“失败”的比例。中心极限定理证明: P 不接近 0 或 1,且 n 很大时,其抽样分布趋近于正态分布。 比例抽样分布的平均误差为:无限总体 ( 或重复抽样 ) :p有限总体 ( 或不重复抽样 ) :pp (1p )n。p(1p)NnnN1 。其他问题与平均数相同。 例题: 据资料记录,二年级的学生中有43

19、%人,阅读某类文章后表示有困难,现随机抽取100 人阅读同类文章,p(1p)0.43(1 0.43)pn0.05100z0.50.431.4与之对应的概率为:0.4192140.05小于 5成的概率为0.50.4192 0.9192t 分布特征:15问:感到有困难的学生占五成以下的概率是多少?习题 1、一家工厂在正常情况下产品次品率为 8%,若产品批量比较大,随机抽取 100 个产品进行检验,求次品率在 7% 9%之间的概率。0.080.920.0271, Z0.070.08p1000.37解:0.0271P(0.07 x0.09)0.1443 20.2886(修正系数可以省略)6、t分布:(小样本理论) t 分布也称“学生分布” 。19081909 年,英国统计学家戈塞特( Goss

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论