




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2.2.2 用样本的数字特征估计 总体的数字特征1.1.正确理解样本数据标准差的意义和作用,学会计算数据正确理解样本数据标准差的意义和作用,学会计算数据的标准差的标准差. .2. 2. 理解用样本的基本数字特征来估计总体的基本数字特征理解用样本的基本数字特征来估计总体的基本数字特征. .(难点)(难点)3.3.会应用相关知识会应用相关知识来来解决简单的统计问题解决简单的统计问题. .( (重点)重点)1.1.对一个未知总体,我们常用样本的频率分布对一个未知总体,我们常用样本的频率分布来来估计总体的估计总体的分布,其中表示样本数据的频率分布的基本方法有哪些?分布,其中表示样本数据的频率分布的基本
2、方法有哪些?图、表图、表总体数据的数字特征总体数据的数字特征 2.2.美国美国NBANBA在在2006200620072007年度赛季中,甲、乙两名篮球运动年度赛季中,甲、乙两名篮球运动员在随机抽取的员在随机抽取的1212场比赛中的得分情况如下:场比赛中的得分情况如下:甲运动员得分:甲运动员得分:1212,1515,2020,2525,3131,3131,3636,3636,3737,3939,4444,49.49.乙运动员得分:乙运动员得分:8 8,1313,1414,1616,2323,2626,2828,3838,3939,5151,3131,29.29.如果要求我们根据上面的数据,估计
3、、比较甲,乙两名运如果要求我们根据上面的数据,估计、比较甲,乙两名运动员哪一位发挥得比较稳定,就得有相应的数据作为比较动员哪一位发挥得比较稳定,就得有相应的数据作为比较依据,即通过样本数据对总体的数字特征进行研究,用样依据,即通过样本数据对总体的数字特征进行研究,用样本的数字特征本的数字特征来来估计总体的数字特征估计总体的数字特征. . 1.1.众数的定义众数的定义: : 在一组数据中,出现次数最多的数据叫做这在一组数据中,出现次数最多的数据叫做这一组数据的众数一组数据的众数. .2.2.中位数的定义中位数的定义: : 将一组数据按大小顺序依次排列,把处将一组数据按大小顺序依次排列,把处在最中
4、间位置的一个数据(或两个数据的平均数)叫做这在最中间位置的一个数据(或两个数据的平均数)叫做这组数据的中位数组数据的中位数. .3.3.平均数的定义平均数的定义: :一组数据的和除以数据的个数所得到的数一组数据的和除以数据的个数所得到的数. .思考思考1 1:怎样将各个样本数据汇总为一个数值,并使它成:怎样将各个样本数据汇总为一个数值,并使它成为样本数据的中心点为样本数据的中心点? ?众数、中位数、平均数众数、中位数、平均数月均用水量月均用水量/t频率频率/组距组距0.500.500.400.400.300.300.200.200.100.100.5 1 1.5 2 2.5 3 3.5 4 4
5、.50.5 1 1.5 2 2.5 3 3.5 4 4.5 O取最高矩形下端中点的取最高矩形下端中点的横坐标横坐标2.252.25作为众数作为众数. . 思考思考2 2:在城市居民月均用水量样本数据的频率分布直方图:在城市居民月均用水量样本数据的频率分布直方图中,你认为众数应在哪个小矩形内?由此估计总体的众数是中,你认为众数应在哪个小矩形内?由此估计总体的众数是什么?什么? 思考思考3 3:在频率分布直方图中,每个小矩形的面积表示什:在频率分布直方图中,每个小矩形的面积表示什么?中位数左右两侧的直方图的面积应有什么关系?么?中位数左右两侧的直方图的面积应有什么关系? 每个小矩形的面积即为所在组
6、的频率,中位数左边和每个小矩形的面积即为所在组的频率,中位数左边和右边的直方图的面积应该相等右边的直方图的面积应该相等从左至右各个小矩形的面积分别是从左至右各个小矩形的面积分别是0.040.04,0.080.08,0.150.15,0.220.22,0.250.25,0.140.14,0.060.06,0.040.04,0.02.0.02.0.5-0.04-0.08-0.15-0.22=0.010.5-0.04-0.08-0.15-0.22=0.01,0.50.5(0.010.010.250.25)=0.02=0.02,所以中位数是,所以中位数是2.02. 2.02. 月均用水量月均用水量/t
7、0.500.500.400.400.300.300.200.200.100.100.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 o o频率频率/组距组距思考思考4 4:平均数是频率分布直方图的:平均数是频率分布直方图的“重心重心”,将频率分布直将频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积方图中每个小矩形的面积与小矩形底边中点的横坐标之积相加,就是样本数据的估计平均数相加,就是样本数据的估计平均数. 由此估计总体的平均由此估计总体的平均数是什么?数是什么?各小矩形底边中点的横坐标为:各小矩形底边中点的横坐标为:0.
8、250.25,0.750.75,1.251.25,1.751.75,2.252.25,2.752.75,3.253.25,3.753.75,4.25.4.25.各小矩形的面积为:各小矩形的面积为:0.04,0.08,0.15,0.22,0.25,0.14,0.06, 0.04,0.08,0.15,0.22,0.25,0.14,0.06, 0.04,0.02.0.04,0.02.月均用水量月均用水量/t0.500.500.400.400.300.300.200.200.100.100.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 o
9、o频率频率/组距组距0.250.250.04+0.750.04+0.750.08+1.250.08+1.250.15+1.750.15+1.750.22+0.22+2.252.250.25+2.750.25+2.750.14+3.250.14+3.250.06+3.750.06+3.750.04+0.04+4.254.250.02=2.020.02=2.02(t t). . 所以平均数是所以平均数是2.02. 2.02. 平均数与中位数相等,是必然还是巧合?平均数与中位数相等,是必然还是巧合?巧合巧合思考:从居民月均用水量样本数据可知,该样本的众数是思考:从居民月均用水量样本数据可知,该样本的
10、众数是2.32.3,中位数是,中位数是2.02.0,平均数是,平均数是1.9731.973,这与我们从样本频率分,这与我们从样本频率分布直方图得出的结论有偏差,你能解释一下原因吗?布直方图得出的结论有偏差,你能解释一下原因吗? 频率分布直方图损失了一些样本数据,得到的是一个估计值,频率分布直方图损失了一些样本数据,得到的是一个估计值,且所得的估计值与数据分组有关且所得的估计值与数据分组有关. .注注: :在只有样本频率分布直方图的情况下,我们可以按上述方在只有样本频率分布直方图的情况下,我们可以按上述方法估计众数、中位数和平均数,并由此估计总体特征法估计众数、中位数和平均数,并由此估计总体特征
11、. .思考:一组数据的中位数一般不受少数几个极端值的影思考:一组数据的中位数一般不受少数几个极端值的影响,这在某些情况下是一个优点,但它对极端值的不敏感响,这在某些情况下是一个优点,但它对极端值的不敏感有时也会成为缺点,你能举例说明吗?样本数据的平均数有时也会成为缺点,你能举例说明吗?样本数据的平均数大于(或小于)中位数说明什么问题?你怎样理解大于(或小于)中位数说明什么问题?你怎样理解“我们我们单位的收入水平比别的单位高单位的收入水平比别的单位高”这句话的含义?这句话的含义? 如:样本数据收集有个别差错不影响中位数;大学毕业生如:样本数据收集有个别差错不影响中位数;大学毕业生凭工资中位数找单
12、位可能收入较低凭工资中位数找单位可能收入较低. . 平均数大于(或小于)中位数,说明样本数据中存在平均数大于(或小于)中位数,说明样本数据中存在许多较大(或较小)的极端值许多较大(或较小)的极端值. . 这句话具有模糊性甚至蒙骗性,其中收入水平是员工这句话具有模糊性甚至蒙骗性,其中收入水平是员工工资的某个中心点,它可以是众数、中位数或平均数工资的某个中心点,它可以是众数、中位数或平均数. .思考思考1 1:在一次射击选拔赛中,甲、乙两名运动员各射击:在一次射击选拔赛中,甲、乙两名运动员各射击1010次,每次命中的环数如下:次,每次命中的环数如下:甲:甲:7 8 7 9 5 4 9 10 7 4
13、7 8 7 9 5 4 9 10 7 4乙:乙:9 5 7 8 7 6 8 6 7 79 5 7 8 7 6 8 6 7 7甲、乙两人本次射击的平均成绩分别为多少环?甲、乙两人本次射击的平均成绩分别为多少环?77xx甲乙, .标准差标准差思考思考2 2:甲、乙两人射击的平均成绩相等,观察两人成绩的:甲、乙两人射击的平均成绩相等,观察两人成绩的频率分布直方图,你能说明其水平差异在哪里吗?频率分布直方图,你能说明其水平差异在哪里吗?甲的成绩比较分散,极差较大甲的成绩比较分散,极差较大; ;乙的成绩相对集中,比较稳定乙的成绩相对集中,比较稳定. .环数环数频率频率0.40.40.30.30.20.2
14、0.10.14 5 6 7 8 9 10 4 5 6 7 8 9 10 O O(甲)(甲)环数环数频率频率0.40.40.30.30.20.20.10.14 5 6 7 8 9 10 4 5 6 7 8 9 10 O O(乙)(乙)思考思考3 3:对于样本数据:对于样本数据x x1 1,x x2 2,x xn n,设想通过各数据到,设想通过各数据到其平均数的平均距离来反映样本数据的分散程度,那么这其平均数的平均距离来反映样本数据的分散程度,那么这个平均距离如何计算?个平均距离如何计算? 12| |nxxxxxxn-+-+-L含有绝对值,运算不方便含有绝对值,运算不方便. .思考思考4 4:反映
15、样本数据的分散程度的大小,最常用的统计:反映样本数据的分散程度的大小,最常用的统计量是标准差,一般用量是标准差,一般用s s表示表示. .假设样本数据假设样本数据x x1 1,x x2 2,x xn n的平均数为的平均数为 ,则标准差的计算公式是:,则标准差的计算公式是:那么标准差的取值范围是什么?标准差为那么标准差的取值范围是什么?标准差为0 0的样本数据有的样本数据有何特点?何特点? s0s0,标准差为,标准差为0 0的样本数据都相等的样本数据都相等. . 22212()()()nxxxxxxsn-+-+-=Lx计算甲、乙两名运动员的射击成绩的标准差,比较其射击计算甲、乙两名运动员的射击成
16、绩的标准差,比较其射击水平的稳定性水平的稳定性. . 甲:甲:7 8 7 9 5 4 9 10 7 47 8 7 9 5 4 9 10 7 4乙:乙:9 5 7 8 7 6 8 6 7 79 5 7 8 7 6 8 6 7 7s s甲甲=2=2,s s乙乙1.095. 1.095. 例例1 1 画出下列四组样本数据的条形图,画出下列四组样本数据的条形图,说明它们的异同点说明它们的异同点. .(1) (1) ,;,;(2) (2) ,;,;解:解:(1)(1)(2)(2)(3) (3) ,;,;(4) (4) ,. .(3)(3)(4)(4)例例2 2 甲乙两人同时生产内径为甲乙两人同时生产内径
17、为25.40 mm25.40 mm的一种零件的一种零件. .为了对为了对两人的生产质量进行评比,从他们生产的零件中各抽出两人的生产质量进行评比,从他们生产的零件中各抽出2020件,量得其内径尺寸如下(单位:件,量得其内径尺寸如下(单位:mmmm):):甲:甲:25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.45 25.38 25.42 25.39 25.43 25.39 25.40 25.45 25.38 25.42 25.39 25.43 25.39 25.40 25
18、.44 25.40 25.42 25.35 25.41 25.3925.44 25.40 25.42 25.35 25.41 25.39乙:乙:25.40 25.43 25.44 25.48 25.48 25.47 25.49 25.40 25.43 25.44 25.48 25.48 25.47 25.49 25.49 26.36 25.34 25.33 25.43 25.43 25.32 25.49 26.36 25.34 25.33 25.43 25.43 25.32 25.47 25.31 25.32 25.32 25.32 25.4825.47 25.31 25.32 25.32 2
19、5.32 25.48从生产零件内径的尺寸看,谁生产的零件质量较高?从生产零件内径的尺寸看,谁生产的零件质量较高? 甲生产的零件内径更接近内径标准,且稳定程度较高,故甲生产的零件内径更接近内径标准,且稳定程度较高,故甲生产的零件质量较高甲生产的零件质量较高. . 说明:说明:生产质量可以从总体的平均数与标准差两个角度来生产质量可以从总体的平均数与标准差两个角度来衡量,但甲、乙两个总体的平均数与标准差都是不知道的,衡量,但甲、乙两个总体的平均数与标准差都是不知道的,我们就用样本的平均数与标准差估计总体的平均数与标准我们就用样本的平均数与标准差估计总体的平均数与标准差差.25. 401,x甲25.
20、406,x乙甲0. 037,s乙0. 068.s解:解:1.101.10名工人某天生产同一零件,生产的件数分别是名工人某天生产同一零件,生产的件数分别是1515,1717,1414,1010,1515,1919,1717,1616,1414,1212,则这一天,则这一天 1010名工名工人生产的零件的中位数是人生产的零件的中位数是( )( )(A)14 (B)16 (C)15 (D)17(A)14 (B)16 (C)15 (D)17【解析解析】选选C.C.把件数从小到大排列为把件数从小到大排列为1010,1212,1414,1414,1515,1515,1616,1717,1717,1919,
21、可知中位数为,可知中位数为15.15.C C2.2.某射击运动员在四次射击中分别打出了某射击运动员在四次射击中分别打出了10,x,10,810,x,10,8环环的成绩,已知这组数据的平均数为的成绩,已知这组数据的平均数为9 9,则这组数据的方,则这组数据的方差是差是_._.【解析解析】由由9= 9= 得得x=8.x=8.故故s s2 2= = (10-9)(10-9)2 2+(8-9)+(8-9)2 2+(10-9)+(10-9)2 2+(8-9)+(8-9)2 2= = 4=1.4=1.答案:答案:1 110 x108414143.3.甲、乙两个班各随机选出甲、乙两个班各随机选出1515名同学进行测验,所得成名同学进行测验,所得成绩的茎叶图如图绩的茎叶图如图. .从图中看,从图中看,_班的平均成绩较高班的平均成绩较高. .【解析解析】结合茎叶图中成绩结合茎叶图中成绩的情况可知,乙班平均成绩较高的情况可知,乙班平
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 新疆机电职业技术学院《创业管理》2023-2024学年第二学期期末试卷
- 兰州职业技术学院《道路景观设计》2023-2024学年第一学期期末试卷
- 昆明冶金高等专科学校《装饰图案基础》2023-2024学年第二学期期末试卷
- 日照航海工程职业学院《首饰设计与制作》2023-2024学年第二学期期末试卷
- 西藏民族大学《医学免疫学研究进展》2023-2024学年第二学期期末试卷
- 吉林电子信息职业技术学院《软件设计开发综合实训》2023-2024学年第二学期期末试卷
- 铜仁职业技术学院《生物质废弃物资源化利用》2023-2024学年第二学期期末试卷
- 上海杉达学院《细胞及分子生物学实验》2023-2024学年第二学期期末试卷
- 江海职业技术学院《天然药物化学》2023-2024学年第一学期期末试卷
- 延安职业技术学院《高频电子电路》2023-2024学年第二学期期末试卷
- 第10课 养成遵纪守法好习惯
- 《手工制作》课件-幼儿园挂饰
- 【初中地理】西亚+课件-2024-2025学年人教版地理七年级下册
- 2025修订版《保障中小企业款项支付条例》解读学习课件
- 鼓励员工发现安全隐患的奖励制度
- 苏教版一年级下册数学全册教学设计(配2025年春新版教材)
- 2025年水质化验工题库 - 副本
- 【特易资讯】2025中国二手车行业出口分析及各国进口政策影响白皮书
- (一诊)2025年兰州市高三诊断考试生物试卷(含官方答案)
- 2025年吉林司法警官职业学院单招职业倾向性考试题库必考题
- 光伏发电项目施工的应急预案与措施
评论
0/150
提交评论