总体分布的估计课件_第1页
总体分布的估计课件_第2页
总体分布的估计课件_第3页
总体分布的估计课件_第4页
总体分布的估计课件_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1.4总体分布的估计.三种抽样方法的比较类别各自特点相互联系适用范围简单随机抽样系统抽样分层抽样共同点从总体中逐个抽取将总体均分成几部分,按事先确定的规则在各部分抽取将总体分成几层,分层进行抽取在起始部分抽样时采用简单随机抽样各层抽样时采用简单随机抽样或系统抽样总体中的个体数较少总体中的个体数较多总体由差异明显的几部分组成抽样过程中每个个体被抽取的概率相等是其他抽样方法的基础前课复习问:对样本抽好后,通过对样本的分析,从而推断总体所具有的性质。如何体现样本分析的这一特点?初中时我们学习过样本的频率分布前课复习总体分布的估计抛掷硬币的大量重复试验的频率分布表:

35964反面向上36124正面向上频率频数实验结果0.50110.4989样本容量为72088频率分布条形图0.10.20.30.40.50.60.701试验结果频率“正面向上”记为0“反面向上”记为1新课教学当试验次数无限增大时,两种试验结果的频率就成为相应的概率,得到下表:0.5反面向上(记为1)0.5正面向上(记为0)概率试验结果

上表排除了抽样造成的误差,精确地反映了总体取值的概率分布规律.这种总体取值的概率分布规律称为总体分布.思考:从上述例子可以看出样本频率分布与总体分布的关系?(1)通过样本的频数分布、频率分布可以估计总体的概率分布.(2)研究总体概率分布往往可以研究其频数分布、频率分布.新课教学1.在100名学生中,每人参加一个运动队,其中参加田径队的有13人,参加体操队的有10人,参加足球队的有24人,参加篮球队的有27人,参加排球队的有15人,参加乒乓球队的有11人.(1)列出学生参加各运动队的频率分布表;(2)画出表示频率分布的条形图.试验结果频数频率参加田径队(1)130.13参加体操队(2)100.10参加足球队(3)240.24参加篮球队(4)270.27参加排球队(5)150.15参加乒乓球队(6)110.11解:频率分布表如下:频率分布条形图如下:152346频率课堂练习例.从规定尺寸为25.40mm的一堆产品中任取100件,测得尺寸如下:

25.3925.3625.3425.4225.4525.3825.3925.4225.4725.3525.4125.4325.4425.4825.4525.4325.4625.4025.5125.4525.4025.3925.4125.3625.3825.3125.5625.4325.4025.3825.3725.4425.3325.4625.4025.4925.3425.4225.5025.3725.3525.3225.4525.4025.2725.4325.5425.3925.4525.4325.4025.4325.4425.4125.5325.3725.3825.2425.4425.4025.3625.4225.3925.4625.3825.3525.3125.3425.4025.3625.4125.3225.3825.4225.4025.3325.3725.4125.4925.3525.4725.3425.3025.3925.4625.2925.4025.3725.3325.4025.3525.4125.3725.3725.4725.3925.4225.4725.3825.39(1)列出样本的频率分布表(2)画出频率分布直方图(3)根据频率分布直方图估计,数据落在[25.355,25.445]的概率约是多少?新课教学显然:这个例子与前面抛掷硬币的问题是不同,这里的总体可以在一个实数区间取值,称为连续型总体。我们可以先得到这些数据的以下频率分布表和频率分布直方图一、计算最大值与最小值的差(也称极差),从而知道这组数据的变动范围。二、决定组距与组数(将数据分组)组距:指每个小组的两个端点的距离,组距=极差/组数列出频率分布表、画频率分布直方图的方法极差为:25.56–25.24=0.3三.决定分点可以令分点比数据多1位小数,并且把第1小组的起点稍微减少一点组数:将数据分组,当数据在100个以内时,按数据多少分成5-12组新课教学分组个数累计频数频率累计频率[25.235,25.265)一10.010.01[25.265,25.295)T20.020.03[25.295,25.325)正50.050.08[25.325,25.355)正正T120.120.20[25.355,25.385)正正正下180.180.38[25.385,25.415)正正正正正250.250.67[25.415,25.445)正正正一160.160.79[25.445,25.475)正正下130.130.92[25.475,25.505)TT40.040.96[25.505,25.535)T20.020.98[25.535,25.565)T20.021.00合计1001.00四.列出频率分布表五.画频率分布直方图注意:直方图的纵轴表示频率与组距的比值,

长方形的面积=画频率分布直方图的步骤1、计算最大值与最小值的差(知道这组数据的变动范围)2、决定组距与组数(将数据分组)组数:将数据分组,当数据在100个以内时,按数据多少常分5-12组。组距:指每个小组的两个端点的距离,3、决定分点4、列出频率分布表.5、画出频率分布直方图。注意:①各直方长条的宽度要相同②相邻长条之间的间隔要适当新课教学思考:频率分布条形图和频率分布直方图是两个相同的概念吗?有什么区别?频率分布的条形图和频率分布直方图的区别

两者是不同的概念;横轴:两者表示内容相同

纵轴:两者表示的内容不相同

频率分布条形图的纵轴(长方形的高)表示频率

频率分布直方图的纵轴(长方形的高)表示频率与组距的比值,其相应组距上的频率等于该组据上长方形的面积。

长方形的面积=新课教学前面的图表表明了所抽取的100件产品中,尺寸落在各个小组内的频率的大小.样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概率.设想样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线——总体密度曲线,如图1-3所示.总体密度曲线反映了总体分布,即反映了总体在各个范围内取值的概率.根据这条曲线,图中带斜线部分的面积,就是总体在区间(a,b)内取值的概率.新课教学总体在区间内取值的概率频率分布表(2)连续型:当总体中的个体所取的数值较多,甚至无限时,其随机变量是是连续型。则样本的频率分布表示形式有:分组个数累计频数频率频率/组距产品尺寸(mm)频率分布直方图样本频率分布中,当样本容量无限增大,组距无限缩小样本频率分布直方图接近于一条光滑曲线——总体密度曲线,反映了总体分布。新课教学通常,我们不易知道一个总体的分布情况。在实践中,往往是是从总体中抽取一个样本,用样本的频率分布去估计总体分布:(1)离散型总体:用样本的频率分布表和频率分布条形图(2)连续型总体:用样本的频率分布表和频率分布直方图样本容量越大,估计就越精确。例如:利用表1-3的频率分布表,可对总体分布进行估计。从表中看到,样本数据落在25.355到25.445之间的频率为0.59,说明产品尺寸在这个范围内的概率约为0.59.新课教学例1.为检测某种产品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,二级品8件,三级品13件,次品14件.(1)列出样本的频率分布表;(2)画出表示样本频率分布的条形图;(3)根据上述结果,估计此种产品为二级品或三级品的概率约是多少.

解:(1)样本的频率分布表为:

0.134次品0.4313三级品0.278二级品0.175一级品频率频数产品解:(2)样本频率分布的条形图为:

0.10.20.30.40.50.60.7一级品二级品产品频率三级品次品(3)此种产品为二级品或三级品的概率约为0.27+0.43=0.7.

例题讲解

例2.为了解某地儿童生长发育情况,抽查了100名7岁女童的身高(cm),已按数据的大小排列如下:84.484.585.285.786.286.486.987.187.387.687.988.288.488.488.588.789.089.089.189.289.389.389.489.890.090.l90.290.390.490.690.790.891.191.191.191.491.791.791.791.891.992.192.592.592.792.792.892.892.992.993.093.193.293.293.493.593.693.693.693.893.994.094.394.394.494.494.494.594.694.794.894.995.095.195.195.195.595.695.696.096.296.396.496.596.897.097.297.397.397.998.398.498.799.299.399.499.5100.7100.9101.5

(l)列出样本数据的频率分布表;(2)画出频率分布直方图;(3)利用频率直方图,估计身高在第4、第5两个组的概率;(4)估计身高不小于90cm的概率;(5)利用频率分布表估计身高的平均值.

解:(1)样本数据的极差(最大值与最小值之差)为R=101.5-84.4=17.1,将组距定为2,第1小组起点取为84,则组数为8,样本的频率分布表为身高[84,86)[86,88)[88,90)[90,92)[92,94)[94,96)[96,98)[98,100)[100,102)合计频数47131720181173100频率.04.07.13.17.20.18.110.070.031.00(2)频率分布直方图(3)身高在第4第5两个小组内的概率的估计为其频率为0.17+0.20=0.37.

(4)身高不小于90cm的频率为第3至第9组内的频率之和0.76,即身高不小于90cm概率的估计值为0.76.

(5)身高的均值的估计为例3.下表给出了从某校500名12岁的男孩中用随机抽样得出的120人的身高资料.(单位:厘米)区间界限122,126)126,130)130,134)134,138)138,142)人数58102233区间界限142,146)146,150)150,154)154,158)人数201165(1)列出样本的频率分布表;(2)画出频率分布直方图

例题讲解解:(1)样本频率分布表:区间分组人数频率122,126)50.04126,130)80.07130,134)100.08134,138)220.18138,142)330.28142,146)200.17146,150)110.09150,154)60.05154,158)50.04合计1201122130138146154158身高(cm)频率组距(2)频率分布直方图例题讲解例4.对某电子元件进行寿命追踪调查,情况如下:寿命(h)100~200200~300300~400400~500500~600个数2030804030(1)列出频率分布表;(2)画出频率分布直方图(3)估计电子元件寿命在100h~400h以内的概率;(4)估计电子元件寿命在400h以上的概率;例题讲解解:(1)样本频率分布表:寿命(h)频数频

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论