上课版 221用样本的频率分布估计总体分布 - 副本_第1页
上课版 221用样本的频率分布估计总体分布 - 副本_第2页
上课版 221用样本的频率分布估计总体分布 - 副本_第3页
上课版 221用样本的频率分布估计总体分布 - 副本_第4页
上课版 221用样本的频率分布估计总体分布 - 副本_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2.2.1用样本的频率分布估计总体分布1、下列问题中,采用怎样的抽样方法比较合理:①从10台冰箱中抽取3台进行质量检查;②某电影院有32排座位,每排有40个座位,座位号为1~40。有一次报告会坐满了听众,会议结束后为听取意见,留下座位号为18的32名听众进行座谈;③某学校有160名教职工,其中教师120名,行政人员16名,后勤人员24名。为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本。

③分层抽样

②系统抽样

①简单随机抽样复习检测133、某工厂生产A、B、C三种不同型号的产品,产品数量之比为2:3:5,现用分层抽样方法抽取一个容量为n的样本,样本中A型产品有16种,那么此样本容量n=______.80复习引入:

统计的基本思想方法:

用样本估计总体,即通常不直接去研究总体,而是通过从总体中抽取一个样本,根据样本的情况去估计总体的相应情况.统计的核心问题:如何根据样本的情况对总体的情况作出一种推断.这里包括两类问题:一类是如何从总体中抽取样本?

简单随机抽样系统抽样分层抽样另一类是如何根据对样本的整理、计算、分析,对总体的情况作出推断.整体介绍:用样本的有关情况去估计总体的相应情况,这种估计大体分为两类,一类是用样本频率分布估计总体分布,一类是用样本的某种数字特征(例如平均数、方差等)去估计总体的相应数字特征。

频数:将一批数据按要求分为若干个组,各组内数据的个数,叫做该组的频数。

频率:每组数据的个数除以全体数据个数的商叫做该组的频率。根据随机抽取样本的大小,分别计算某一事件出现的频率,这些频率的分布规律(取值状况),就叫做样本的频率分布。说明:样本频率分布与总体频率分布有什么关系?通过样本的频数分布、频率分布可以估计总体的频率分布.如何用样本的频率分布估计总体分布?我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费。如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?探究:你认为,为了较为合理地确定出这个标准,需要做哪些工作?我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费。如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?探究:①采用抽样调查的方式获得样本数据②分析样本数据来估计全市居民用水量的分布情况分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息。表格则是通过改变数据的构成形式,为我们提供解释数据的新方式讨论:如何分析数据?根据这些数据你能得出用水量其他信息吗?为此我们要对这些数据进行整理与分析通过抽样,我们获得了100位居民某年的月平均用水量(单位:t),如下表:

〈一〉频率分布的概念:频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布〈二〉画频率分布直方图其一般步骤为:(1)计算一组数据中最大值与最小值的差,即求极差(2)决定组距与组数(3)将数据分组(4)列频率分布表(5)画频率分布直方图第一步:求极差:(数据组中最大值与最小值的差距)

最大值=4.3最小值=0.2所以极差=4.3-0.2=4.1第二步:决定组距与组数:

(强调取整)

当样本容量不超过100时,按照数据的多少,常分成5~12组.为方便组距的选择应力求“取整”.本题如果组距为0.5(t).则第三步:将数据分组:(给出组的界限)

所以将数据分成9组较合适.

[0,0.5),[0.5,1),[1,1.5),……[4,4.5)共9组.

第四步:列频率分布表.

分组(x)频数频率(频数/总数)频率/组距(y)[0-0.5)4[0.5-1)8[1-1.5)15[1.5-2)22[2-2.5)25[2.5-3)15[3-3.5)5[3.5-4)4[4-4.5)2合计100组距=0.5

0.040.080.080.160.30.150.440.220.250.512.000.020.040.040.080.10.30.150.0500.10.20.30.40.50.60.511.522.533.544.5第五步:画出频率分布直方图.频率/组距

月均用水量/t

(组距=0.5)

0.080.160.30.440.50.30.10.080.04小长方形的面积=?小长方形的面积总和=?月均用水量最多的在哪个区间?频率分布直方图的特征:从频率分布直方图可以清楚的看出数据分布的总体趋势。从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了。思考:频率分布表与频率分布直方图的区别?频率分布表列出的是在各个不同区间内取值的频率。频率分布直方图是用小长方形面积的大小来表示在各个区间内取值的频率。注意(2)纵坐标为:练习:有一个容量为50的样本数据的分组的频数如下:[12.5,15.5)3[15.5,18.5)8[18.5,21.5)9[21.5,24.5)11[24.5,27.5)10[27.5,30.5)5[30.5,33.5)4(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)根据频率分布直方图估计,数据落在[15.5,24.5)的百分比是多少?解:组距为3

分组频数频率频率/组距[12.5,15.5)3[15.5,18.5)8[18.5,21.5)9[21.5,24.5)11[24.5,27.5)10[27.5,30.5)5[30.5,33.5)40.060.160.180.220.200.100.080.0200.0530.0600.0730.0670.0330.027频率分布直方图如下:频率组距0.0100.0200.0300.0400.05012.515.50.0600.070课堂小结(二)频率分布折线图:画好频率分布图后,我们把频率分布直方图中各小长方形上端的中点连接起来,得到的图形就叫频率分布折线图.00.10.20.30.40.50.60.511.522.533.544.5画出频率分布折线图.频率/组距月均用水量/t(取组距中点,并连线)0.080.160.30.440.50.30.10.080.04在样本频率分布直方图中,当样本容量增加,作图时所分的组数增加,组距减少,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.总体密度曲线:月均用水量/t频率组距0ab月均用水量/t频率组距0ab1.对于任何一个总体,它的密度曲线是不是一定存在?它的密度曲线是否可以被非常准确地画出来?思考2.图中阴影部分的面积表示什么?2.总体在范围(a,b)内取值的百分比月均用水量/t频率组距0ab1.实际上,尽管有些总体密度曲线是客观存在的,但一般很难像函数图象那样准确地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估计就越精确。茎叶图:

当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图

例某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:(1)甲运动员得分:13,51,23,8,26,38,16,33,14,28,39(2)乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39甲乙01234525541616794908463368389

1甲乙01234525541616794908463368389

1从这个茎叶图可以看出,乙运动员的得分大致对称,叶的分布是“单峰”的,大多数的叶集中在茎2,3,4上,中位数是36;甲运动员的得分除一个特殊得分外,也大致对称,叶的分布也是“单峰”的,大多数的叶集中在茎1,2,3上,中位数是26。由此可以看出,乙运动员的发挥更稳定,成绩更好。优点:(1)保留了原始数据,没有损失样本信息;(2)数据可以随时记录、添加或修改.缺点:不适合样本容量很大或茎、叶不分明的样本数据.练习1、从两个班中各随机的抽取10名学生,他们的数学成绩如下:甲班:76,74,82,96,66,76,78,72,52,68乙班:86,84,62,76,78,92,82,74,88,85画出茎叶图并分析两个班学生的数学学习情况。

由茎叶图可知,乙班的成绩较好,而且较稳定。解析:练习2:对于样本频率分布折线图与总体密度曲线的关系,下列说法中正确的是()A、频率分布折线图与总体密度曲线无关B、频率分布折线图就是总体密度曲线C、样本容量很大的频率分布折线图就是总体密度曲线D、如果样本容量无限增大,分组的组距无限减小,那么频率分布折线图就会无限接近于总体密度曲线D3、一个容量为20的样本,分组后组距与频数如下:

[10,20],2;(20,30],3;(30,40],4;(40,50],5;(50,60],4;(60,70],2,

则样本在(10,50]上的频率为()4、对于用样本频率估计总体分布的过程,下列说法中正确的是()A.总体容量越大,估计越准确B.总体容量越小,估计越准确C.样本容量越大,估计越准确D.样本容量越小,估计越准确DCA根据上图可得这100名学生中体重在[56.5,64.5]的学生人数是()A.20

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论