用样本频率分布估计总体分布教材_第1页
用样本频率分布估计总体分布教材_第2页
用样本频率分布估计总体分布教材_第3页
用样本频率分布估计总体分布教材_第4页
用样本频率分布估计总体分布教材_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2.2.1用样本的频率分布估计总体分布频率分布的表示形式有:①样本频率分布表②样本频率分布图样本频率分布条形图样本频率分布直方图③样本频率分布折线图

1、初中时我们学习过样本的频率分布,包括频数、频率的概念,频数分布表和频数分布直方图的制作。例1.

为检测某种产品的质量,抽取了一个容量为30的样本,检测结果为一级品5件,二级品8件,三级品13件,次品4件.(1)列出样本的频率分布表;(2)画出表示样本频率分布的条形图;(3)根据上述结果,估计此种产品为二级品或三级品的概率约是多少.

解:(1)样本的频率分布表为:

0.134次品0.4313三级品0.278二级品0.175一级品频率频数产品解:(2)样本频率分布的条形图为:

0.10.20.30.40.50.60.7一级品二级品产品频率三级品次品(3)此种产品为二级品或三级品的概率约为0.27+0.43=0.7.

知识探究(一):频率分布表【问题】

我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.通过抽样调查,获得100位居民2007年的月均用水量如下表(单位:t):3.12.52.02.01.51.01.61.81.91.63.42.62.22.21.51.20.20.40.30.43.22.72.32.11.61.23.71.50.53.83.32.82.32.21.71.33.61.70.64.13.22.92.42.31.81.43.51.90.84.33.02.92.42.41.91.31.41.80.72.02.52.82.32.31.81.31.31.60.92.32.62.72.42.11.71.41.21.50.52.42.52.62.32.11.61.01.01.70.82.42.82.52.22.01.51.01.21.80.62.2显然:这里的总体可以在一个实数区间取值,称为连续型总体。样本的频率分布表示形式有:

频率分布表和频率分布直方图1.极差:样本数据中的最大值和最小值的差称为极差2.确定组距,组数:.如果将上述100个数据按组距为0.5进行分组,那么这些数据共分为多少组?0.2~4.3(4.3-0.2)÷0.5=8.2

3将数据分组,决定分点:以组距为0.5进行分组,上述100个数据共分为9组,各组数据的取值范围可以如何设定?4画频率分布表:如何统计上述100个数据在各组中的频数?如何计算样本数据在各组中的频率?你能将这些数据用表格反映出来吗?[0,0.5),[0.5,1),[1,1.5),…,[4,4.5].

分组频数累计频数频率

[0,0.5)40.04[0.5,1)正80.08[1,1.5)正正正150.15[1.5,2)正正正正220.22[2,2.5)正正正正正250.25[2.5,3)正正140.14[3,3.5)正一60.06[3.5,4)40.04[4,4.5]20.02

合计1001.00频率分布表:知识探究(二):频率分布直方图5画频率分布直方图为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的图形表示:月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O上图称为频率分布直方图,其中横轴表示月均用水量,纵轴表示频率/组距.频率分布直方图中各小长方形的宽度和高度在数量上有何特点?月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O宽度:组距高度:频率组距2图形的意义图形的意义:频率分布直方图中各小长方形的面积表示什么?各小长方形的面积之和为多少?各小长方形的面积=频率各小长方形的面积之和=1月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O宽度:组距高度:频率组距3分析例题:你能根据上述频率分布直方图指出居民月均用水量的一些数据特点吗?月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O(1)居民月均用水量的分布是“山峰”状的,而且是“单峰”的;(2)大部分居民的月均用水量集中在一个中间值附近,只有少数居民的月均用水量很多或很少;(3)居民月均用水量的分布有一定的对称性等.月均用水量/t频率组距0.50.40.30.20.10.511.522.533.544.5O思考:对一组给定的样本数据,频率分布直方图的外观形状与哪些因素有关?在居民月均用水量样本中,你能以1为组距画频率分布直方图吗?

与分组数(或组距)及坐标系的单位长度有关.月均用水量/t频率组距0.40.30.20.112345

O1、求极差(即一组数据中最大值与最小值的差)

知道这组数据的变动范围4.3-0.2=4.12、决定组距与组数(将数据分组)3、将数据分组(8.2取整,分为9组)画频率分布直方图的步骤4、列出频率分布表.(填写频率/组距一栏)5、画出频率分布直方图。组距:指每个小组的两个端点的距离组数:将数据分组,当数据在100个以内时,按数据多少常分5-12组。频率分布的条形图和频率分布直方图的区别两者是不同的概念;横轴:两者表示内容相同思考:频率分布条形图和频率分布直方图是两个相同的概念吗?有什么区别?纵轴:两者表示的内容不相同频率分布条形图的纵轴(长方形的高)表示频率频率分布直方图的纵轴(长方形的高)表示频率与组距的比值,其相应组距上的频率等于该组距上长方形的面积。频率分布直方图如下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图利用样本频分布对总体分布进行相应估计(2)样本容量越大,这种估计越精确。(1)上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?总体密度曲线频率组距月均用水量/tab(图中阴影部分的面积,表示总体在某个区间(a,b)内取值的百分比)。当样本容量无限增大,分组的组距无限缩小,那么频率分布折线图就会无限接近一条光滑曲线——总体密度曲线.总体密度曲线

用样本分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。

总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具.总体密度曲线茎叶图某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:(1)甲运动员得分:13,51,23,8,26,38,16,33,14,28,39(2)乙运动员得分:

49,24,12,31,50,31,44,36,15,37,25,36,39

甲乙

804631253682543893161679449150注:中间的数字表示得分的十位数字。

旁边的数字分别表示两个人得分的个位数。茎叶图当样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留所有的信息,而且可以随时记录,给数据的记录和表示都方便。练习:某中学高一(2)班甲,乙两名同学自高中以来每场数学考试成绩情况如下:甲的得分:95,81,75,91,86,89,71,65,76,88,94乙的得分:83,86,93,99,88,96,98,98,79,85,97画出两人数学成绩茎叶图,请根据茎叶图对两人的成绩进行比较。

小结图形优点缺点频率分布1)易表示大量数据丢失一些直方图

2)直观地表明分布地情况信息

1)无信息损失只能处理样本茎页图

2)随时记录方便记录和表示容量较小数据课堂小结表示样本分布的方法:(1)频率分布表(2)频率分布图(包括直方图和条形图)(3)频率分布折线图(4)茎叶图一众数、中位数、平均数的概念中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.

众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.

平均数:一组数据的算术平均数,即

问题1:众数、中位数、平均数这三个数一般都会来自于同一个总体或样本,它们能表明总体或样本的什么性质?平均数:反映所有数据的平均水平

众数:反映的往往是局部较集中的数据信息

中位数:是位置型数,反映处于中间部位的数据信息

1、求下列各组数据的众数(1)、1,2,3,3,3,5,5,8,8,8,9,9众数是:3和8(2)、1,2,3,3,3,5,5,8,8,9,9众数是:32、求下列各组数据的中位数(1)、1,2,3,3,3,4,6,8,8,8,9,9(2)1,2,3,3,3,4,8,8,8,9,9中位数是:5中位数是:4

3、在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如下表所示:成绩(米)1.501.601.651.701.751.801.851.90人数23234111分别求这些运动员成绩的众数,中位数与平均数。解:在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75.上面表里的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是1.70;

答:17名运动员成绩的众数、中位数、平均数依次是1.75(米)、1.70(米)、1.69(米)。

这组数据的平均数是二、众数、中位数、平均数与频率分布直方图的关系频率组距0.10.20.30.40.5O0.511.522.533.544.5月平均用水量(t)

众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。如何在频率分布直方图中估计众数可将众数看作直方图中面积最大长方形的“中心”0.52.521.5143.534.5频率组距0.040.080.150.220.250.140.060.040.02前四个小矩形的面积和=0.49后四个小矩形的面积和=0.262.02如何在频率分布直方图中估计中位数分组[0,0.5)[0.5,1)[1,1.5)[1.5,2)[2,2.5)[2.5,3)[3,3.5)[3.5,4)[4,4.5]合计频率0.040.080.150.220.250.140.060.040.021在样本中中位数的左右各有50%的样本数,条形面积各为0.5,所以反映在直方图中位数左右的面积相等.,中位数)可将中位数看作整个直方图面积的“中心”思考讨论以下问题:1、2.02这个中位数的估计值,与样本的中位数值2.0不一样,你能解释其中原因吗?答:2.02这个中位数的估计值,与样本的中位数值2.0不一样,这是因为样本数据的频率分布直方图,只是直观地表明分布的形状,但是从直方图本身得不出原始的数据内容,直方图已经损失一些样本信息。所以由频率分布直方图得到的中位数估计值往往与样本的实际中位数值不一致.如何在频率分布直方图中估计平均数=2.02=2.02平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和。可将平均数看作整个直方图面积的“重心”

思考讨论以下问题:2、样本中位数不受少数极端值的影响,这在某些情况下是一个优点,但它对极端值的不敏感有时也会成为缺点。你能举例说明吗?答:优点:对极端数据不敏感的方法能够有效地预防错误数据的影响。对极端值不敏感有利的例子:例如当样本数据质量比较差,即存在一些错误数据(如数据录入错误、测量错误等)时,用抗极端数据强的中位数表示数据的中心值更准确。缺点:(1)出现错误的数据也不知道;(2)对极端值不敏感有弊的例子:某人具有初级计算机专业技术水平,想找一份收入好的工作。这时如果采用各个公司计算机专业技术人员收入的中位数作为选择工作的参考指标就会冒这样的风险:很可能所选择公司的初级计算机专业技术水平人员的收入很低,其原因是中位数对极小的数据不敏感。这里更好的方法是同时用平均工资和中位数作为参考指标,选择平均工资较高且中位数较大的公司就业.例1、下表是七位评委给某参赛选手的打分,总分为10分,你认为如何计算这位选手的最后得分才较为合理?评委1号2号3号4号5号6号7号

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论