版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2.2 2.2 用样本估计总体用样本估计总体.2.2.2.2用样本的数字特征估计总体的用样本的数字特征估计总体的数字特征数字特征 第一课时第一课时 问题提出问题提出1.1.对一个未知总体,我们常用样本的频率分对一个未知总体,我们常用样本的频率分布估计总体的分布,其中表示样本数据的频布估计总体的分布,其中表示样本数据的频率分布的根本方法有哪些?率分布的根本方法有哪些? 2.2.美国美国NBANBA在在2006200720062007年度赛季中,甲、年度赛季中,甲、乙两名篮球运发动在随机抽取的乙两名篮球运发动在随机抽取的1212场竞赛中场竞赛中的得分情况如下:的得分情况如下:甲运发动得分:甲运发动
2、得分:1212,1515,2020,2525,3131,3131, 36 36,3636,3737,3939,4444,49.49.乙运发动得分:乙运发动得分:8 8,1313,1414,1616,2323,2626, 28 28,3838,3939,5151,3131,29.29. 假设要求我们根据上面的数据,估假设要求我们根据上面的数据,估计、比较甲,乙两名运发动哪一位发计、比较甲,乙两名运发动哪一位发扬得比较稳定,就得有相应的数据作扬得比较稳定,就得有相应的数据作为比较根据,即经过样本数据对总体为比较根据,即经过样本数据对总体的数字特征进展研讨,用样本的数字的数字特征进展研讨,用样本的数
3、字特征估计总体的数字特征特征估计总体的数字特征. 甲运发动得分:甲运发动得分:1212,1515,2020,2525,3131,3131, 3636,3636,3737,3939,4444,49.49.乙运发动得分:乙运发动得分:8 8,1313,1414,1616,2323,2626, 2828,3838,3939,5151,3131,29.29.知识探求一:众数、中位数和平均数知识探求一:众数、中位数和平均数 思索思索1 1:在初中我们学过众数、中位数和:在初中我们学过众数、中位数和平均数的概念,这些数据都是反映样本平均数的概念,这些数据都是反映样本信息的数字特征,对一组样本数据如何信息的
4、数字特征,对一组样本数据如何求众数、中位数和平均数?求众数、中位数和平均数? 思索思索2 2:在城市居民月均用水量样本数据:在城市居民月均用水量样本数据的频率分布直方图中,他以为众数应在的频率分布直方图中,他以为众数应在哪个小矩形内?由此估计总体的众数是哪个小矩形内?由此估计总体的众数是什么?什么? 月均用水量月均用水量/t频率频率组距组距0.50.50.40.40.30.30.20.20.10.10.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O思索思索3 3:在频率分布直方图中,每个小矩:在频率分布直方图中,每个小矩形的面积表
5、示什么?中位数左右两侧的形的面积表示什么?中位数左右两侧的直方图的面积应有什么关系?直方图的面积应有什么关系?取最高矩形下端取最高矩形下端中点的横坐标中点的横坐标2.252.25作为众数作为众数. . 思索思索4 4:在城市居民月均用水量样本数据的频:在城市居民月均用水量样本数据的频率分布直方图中,从左至右各个小矩形的面率分布直方图中,从左至右各个小矩形的面积分别是积分别是0.040.04,0.080.08,0.150.15,0.220.22,0.250.25,0.140.14,0.060.06,0.040.04,0.02.0.02.由此估计总体的由此估计总体的中位数是什么?中位数是什么? 月
6、均用水量月均用水量/t频率频率组距组距0.50.50.40.40.30.30.20.20.10.10.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O O0.5-0.04-0.08-0.15-0.22=0.010.5-0.04-0.08-0.15-0.22=0.01,0.010.010.5=0.020.5=0.02,中位数是,中位数是2.02. 2.02. 思索思索5 5:平均数是频率分布直方图的:平均数是频率分布直方图的“重心,重心,在城市居民月均用水量样本数据的频率分布在城市居民月均用水量样本数据的频率分布直方图中,各个小矩形的
7、重心在哪里?从直直方图中,各个小矩形的重心在哪里?从直方图估计总体在各组数据内的平均数分别为方图估计总体在各组数据内的平均数分别为多少?多少?0.250.25,0.750.75,1.251.25,1.751.75,2.252.25, 2.752.75,3.253.25,3.753.75,4.25. 4.25. 月均用水量月均用水量/t频率频率组距组距0.50.50.40.40.30.30.20.20.10.10.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O O思索思索6 6:根据统计学中数学期望原理,将频率:根据统计学中数学期望
8、原理,将频率分布直方图中每个小矩形的面积与小矩形底分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积相加,就是样本数据的边中点的横坐标之积相加,就是样本数据的估值平均数估值平均数. . 由此估计总体的平均数是什么?由此估计总体的平均数是什么?0.250.250.04+0.750.04+0.750.08+1.250.08+1.250.15+1.750.15+1.750.22+2.250.22+2.250.25+2.750.25+2.750.14+3.250.14+3.25 0.06+3.750.06+3.750.04+4.250.04+4.250.02=2.020.02=2.02t t.
9、. 平均数是平均数是2.02. 2.02. 平均数与中位数相等,是必然还是巧合?平均数与中位数相等,是必然还是巧合?知识回想知识回想1.1.如何根据样本频率分布直方图,分如何根据样本频率分布直方图,分别估计总体的众数、中位数和平均数?别估计总体的众数、中位数和平均数?1 1众数:最高矩形下端中点的横坐标众数:最高矩形下端中点的横坐标. .2 2中位数:直方图面积平分线与横轴中位数:直方图面积平分线与横轴交点的横坐标交点的横坐标. .3 3平均数:每个小矩形的面积与小矩平均数:每个小矩形的面积与小矩形底边中点的横坐标的乘积之和形底边中点的横坐标的乘积之和. . 思索思索7 7:从居民月均用水量样
10、本数据可知,该:从居民月均用水量样本数据可知,该样本的众数是样本的众数是2.32.3,中位数是,中位数是2.02.0,平均数是,平均数是1.9731.973,这与我们从样本频率分布直方图得出,这与我们从样本频率分布直方图得出的结论有偏向,他能解释一下缘由吗?的结论有偏向,他能解释一下缘由吗? 频率分布直方图损失了一些样本数据,得频率分布直方图损失了一些样本数据,得到的是一个估计值,且所得估值与数据分组到的是一个估计值,且所得估值与数据分组有关有关. .注注: :在只需样本频率分布直方图的情况下,我在只需样本频率分布直方图的情况下,我们可以按上述方法估计众数、中位数和平均们可以按上述方法估计众数
11、、中位数和平均数,并由此估计总体特征数,并由此估计总体特征. .思索思索8 8:一组数据的中位数普通不受少数:一组数据的中位数普通不受少数几个极端值的影响,这在某些情况下是几个极端值的影响,这在某些情况下是一个优点,但它对极端值的不敏感有时一个优点,但它对极端值的不敏感有时也会额成为缺陷,他能举例阐明吗?样也会额成为缺陷,他能举例阐明吗?样本数据的平均数大于或小于中位数本数据的平均数大于或小于中位数阐明什么问题?他怎样了解阐明什么问题?他怎样了解“我们单位我们单位的收入程度比别的单位高这句话的含的收入程度比别的单位高这句话的含义?义? 如:样本数据搜集有个别过失不影响中如:样本数据搜集有个别过
12、失不影响中位数;大学毕业生凭工资中位数找单位位数;大学毕业生凭工资中位数找单位能够收入较低能够收入较低. . 平均数大于或小于中位数,阐明平均数大于或小于中位数,阐明样本数据中存在许多较大或较小的样本数据中存在许多较大或较小的极端值极端值. . 这句话具有模糊性甚至蒙骗性,其中这句话具有模糊性甚至蒙骗性,其中收入程度是员工工资的某个中心点,它收入程度是员工工资的某个中心点,它可以是众数、中位数或平均数可以是众数、中位数或平均数. .小结:众数、中位数、平均数各自优缺陷小结:众数、中位数、平均数各自优缺陷 众数:众数容易计算,表达了样本数据众数:众数容易计算,表达了样本数据的最大集中点,但它只能
13、表示样本数据中的最大集中点,但它只能表示样本数据中的很少一部分信息。的很少一部分信息。 中位数:它不受少数几个极端值影响,易中位数:它不受少数几个极端值影响,易计算能较好的表现数字信息,中位数常用计算能较好的表现数字信息,中位数常用语数据质量较差、数据有错误的。语数据质量较差、数据有错误的。 平均数:可以反映出更多关于样本数据全平均数:可以反映出更多关于样本数据全体信息,担起受极端值影响大。体信息,担起受极端值影响大。1.1.数据:数据:1 1,1 1,3 3,3 3的众数和中位数分的众数和中位数分 别是别是 ( )( )A.1A.1或或3 3,2 2B.3B.3,2 2C.1C.1或或3 3
14、,1 1或或3 3D.3D.3,3 32.2.频率分布直方图中最高小矩形的中间频率分布直方图中最高小矩形的中间位置所对的数字特征是位置所对的数字特征是( )( )A.A.中位数中位数B.B.众数众数C.C.平均数平均数D.D.规范差规范差练习小测练习小测思索思索3 3:对于样本数据:对于样本数据x1x1,x2x2,xnxn,想象经过各数据到其平均数的平均间隔想象经过各数据到其平均数的平均间隔来反映样本数据的分散程度,那么这个来反映样本数据的分散程度,那么这个平均间隔如何计算?平均间隔如何计算? 12| |nxxxxxxn-+-+-L思索思索4 4:反映样本数据的分散程度的大小,最:反映样本数据
15、的分散程度的大小,最常用的统计量是规范差,普通用常用的统计量是规范差,普通用s s表示表示. .假设假设样本数据样本数据x1x1,x2x2,xnxn的平均数为,那么的平均数为,那么规范差的计算公式是:规范差的计算公式是:22212()()()nxxxxxxsn-+-+-=L 那么规范差的取值范围是什么?规范差为那么规范差的取值范围是什么?规范差为0 0的样本数据有何特点?的样本数据有何特点? s0s0,规范差为,规范差为0 0的样本数据都相等的样本数据都相等. . 思索思索5 5:对于一个容量为:对于一个容量为2 2的样本:的样本:x1x1,x2(x1x2)x2(x1x2),那么,那么 , ,
16、 在数轴上,这两个统计数据有什么几何意义?在数轴上,这两个统计数据有什么几何意义?由此阐明规范差的大小对数据的离散程度有由此阐明规范差的大小对数据的离散程度有何影响?何影响? 122xxx+=212xxs-=规范差越大离散程度越大,数据较分散;规范差越大离散程度越大,数据较分散;规范差越小离散程度越小,数据较集中规范差越小离散程度越小,数据较集中在平均数周围在平均数周围. . 知识迁移知识迁移 s s甲甲=2=2,s s乙乙=1.095. =1.095. 计算甲、乙两名运发动的射击成果的计算甲、乙两名运发动的射击成果的规范差,比较其射击程度的稳定性规范差,比较其射击程度的稳定性. 甲:甲:7 8 7 9 5 4 9 10 7 47 8 7 9 5 4 9 10 7 4乙:乙:9 5 7 8 7 6 8 6 7 79 5 7 8 7 6 8 6 7 7小结作业小结作业1.1.用样本的数字特征估计总体的数字特征,用样本的数字特征估计总体的数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五版安全防范设备安装与保安人员劳务合同2篇
- 2025版太阳能光伏发电系统安装与安全检验合同3篇
- 《养老保险宣传方案》课件
- 2025年度个人投资理财合同4篇
- 2025版万科物业知识共享与培训服务合同3篇
- 2025版户外广告牌清洗及维护服务合同3篇
- 2025版司机车辆维护保养合同3篇
- 二零二五年度大数据分析服务借款合同协议2篇
- 2025年度铝单板智能制造技术改造项目合同4篇
- 2025版我国行政救济制度优化与执行监督合同3篇
- 2025-2030年中国陶瓷电容器行业运营状况与发展前景分析报告
- 二零二五年仓储配送中心物业管理与优化升级合同3篇
- 2025届厦门高三1月质检期末联考数学答案
- 音乐作品录制许可
- 江苏省无锡市2023-2024学年高三上学期期终教学质量调研测试语文试题(解析版)
- 拉萨市2025届高三第一次联考(一模)英语试卷(含答案解析)
- 开题报告:AIGC背景下大学英语教学设计重构研究
- 师德标兵先进事迹材料师德标兵个人主要事迹
- 连锁商务酒店述职报告
- 《实践论》(原文)毛泽东
- 第三单元名著导读《红星照耀中国》(公开课一等奖创新教学设计+说课稿)
评论
0/150
提交评论